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VORWORT ZUR DEUTSCHEN AUSGABE 


Es freut mich sehr, daß mein Buch ‚Die Monte-Carlo-Methode und verwandte 
Fragen‘ nun auch einem breiten Kreis deutscher Leser zugänglich wird. Dafür 
danke ich an dieser Stelle dem VEB Deutscher Verlag der Wissenschaften als 
Herausgeber und den Übersetzern, Herrn Professor Dr. ERICH ScHINckE und Herrn 
Dr. MARTIN SCHLEIFF, Halle. Ich kann mir vorstellen, daß es keine leichte Aufgabe 
war, diese Übersetzung anzufertigen, zumal die Monte-Carlo-Methode mit vielen 
angewandten Fragen verknüpft ist, die ihre eigene Terminologie besitzen. 

Seit dem Erscheinen der russischen Ausgabe des Buches wurden eine beträcht- 
liche Anzahl von Arbeiten veröffentlicht, die zur Weiterentwicklung der Monte- 
Carlo-Methode und ihrer Anwendungen wesentlich beitrugen. Das zeugt sowohl 
von der raschen Entwicklung der Methode selbst als auch von der Aktualität einer 
Reihe theoretischer Aufgaben, die in das Buch aufgenommen wurden. 

In der vorliegenden Ausgabe wurden einige Korrekturen vorgenommen und 
eine Liste mit Titeln hinzugefügt, die nach 1965 in der ganzen Welt erschienen 
sind. Bei einer solchen Bibliographie ist es schwer, Anspruch auf Vollständigkeit 
zu erheben, aber ich hoffe, daß die grundlegenden Arbeiten theoretischen Charak- 
ters in dieser Bibliographie enthalten sind. Dabei ist zu beachten, daß in die 
Ergänzungsliste solche Titel nicht aufgenommen wurden, die schon in den Biblio- 
graphien der Comp. Reviews auftreten 


S. M. ERMAKoOw 


VORWORT DER ÜBERSETZER 


Die unter dem Begriff Monte-Carlo-Methode zusammengefaßten Verfahren der 
numerischen Mathematik haben in den vergangenen Jahren in immer größerem 
Umfang bei der Lösung verschiedenartiger numerischer Probleme Anwendung 
gefunden. Während bereits einige in die Monte-Carlo-Methode einführende Bücher 
in deutscher Sprache vorliegen, fehlte bisher ein Buch, das die Vielfalt der Anwen- 
dungsmöglichkeiten dieser Methode von einem fundierten mathematischen Stand- 
punkt her darstellt. Das im Jahr 1971 in Moskau erschienene Buch von Prof. 
Dr. S.M. ErMAKoWw bietet gerade in dieser Hinsicht eine ausführliche, aber doch 
kompakte Darstellung der Verfahren der Monte-Carlo-Methode. Die Herausgeber 
der deutschen Übersetzung hoffen daher, mit dem vorliegenden Buch eine bislang 
vorhandene Lücke schließen zu können. 

An den Universitäten wird gewöhnlich die Monte-Carlo-Methode in Spezialvor- 
lesungen für Studenten höherer Semester behandelt. Das vorliegende Buch bietet 
eine gute Ergänzung zu einer derartigen Vorlesung; insbesondere wird das grund- 
legende Problem der Integralberechnung in großer Ausführlichkeit unter verschie- 
densten Gesichtspunkten dargestellt. Aber auch für ein einführendes Selbststu- 
dium ist das Buch durchaus geeignet, da alle in der Monte-Carlo-Methode benötig- 
ten Grundkenntnisse der Wahrscheinlichkeitstheorie und Statistik am Anfang 
kurz dargestellt werden. Dem in der Praxis tätigen Mathematiker bietet dieses 
Buch ebenfalls viele Anregungen. Der Autor war bemüht, nicht bei einer rein 
theoretischen Beschreibung der Verfahren der Monte-Carlo-Methode stehenzu- 
bleiben, sondern stets eine fundierte Einschätzung der Effektivität der einzelnen 
numerischen Verfahren zu geben. Zur Erhöhung der Effektivität werden haupt- 
sächlich verschiedene Methoden zur Dispersionsverkleinerung untersucht. Der 
Mathematiker findet hier also viele Hinweise, wann die Anwendung der Monte- 
Carlo-Methode sinnvoll ist und in welcher Weise diese Anwendung erfolgen 
sollte. 

Schließlich bietet das Buch auch dem in der Forschung tätigen Mathematiker 
zahlreiche Anregungen. Der Autor weist an vielen Stellen auf noch offene Probleme 
hin und gibt damit den Anstoß zur weiteren Untersuchung der mit der Monte- 
Carlo-Methode verbundenen Fragestellungen. 

Bei der Übersetzung wurde angestrebt, eine möglichst wortgetreue Wiedergabe 
zu erreichen, damit die im russischen Original bewährte Darstellung erhalten 
bleibt. Andererseits wurde an manchen Stellen auch eine freiere Übertragung 
gewählt, wenn damit das Verständnis erleichtert und eine größere Einheit- 
lichkeit erreicht wurde. Im russischen Original waren eine größere Zahl von 
Druckfehlern, aber auch einige Ungenauigkeiten enthalten. Die Übersetzer 
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waren bemüht, diese Unstimmigkeiten zu korrigieren, ohne daß darauf im einzelnen 
hingewiesen wird. Eine wesentliche Hilfe war dabei ein vom Autor zur Verfügung 
gestelltes Fehlerverzeichnis mit entsprechenden Berichtigungen. 
Für die Reinschrift des Manuskripts danken die Herausgeber Frau E. Worr. 
Schließlich sei dem Verlag und der Druckerei für die ansprechende Gestaltung 
der deutschen Ausgabe gedankt. 


ERICH SCHINCKE 
MARTIN SCHLEIFF 


VORWORT ZUR RUSSISCHEN AUSGABE 


Dieses Buch stellt eine erweiterte Fassung der Vorlesungen dar, die der Autor an 
der mathematisch-mechanischen Fakultät der Leningrader staatlichen Universität 
gehalten hat. 


Bekanntlich setzt sich die Monte-Carlo-Methode aus drei Bestandteilen zu- 
sammen: erstens die Erzeugung von Zufallsgrößen mit gegebenem Verteilungs- 
gesetz, zweitens der Aufbau stochastischer Modelle realer Prozesse (Systeme) und 
drittens die Lösung von gewissen Aufgaben aus der statistischen Theorie der 
Schätzungen. Die unmittelbare Modellierung realer Prozesse führt bei weitem 
nicht immer zum Erfolg, und in diesen Fällen entsteht die Aufgabe, gewisse ‚‚fik- 
tive‘ Modelle zu schaffen, die eine effektivere Lösung der gestellten Aufgabe ge- 
statten. 


Diese letzte Aufgabe und auch spezielle Aufgaben aus der statistischen Theorie 
der Schätzungen, die bei der Monte-Carlo-Methode auftreten, werden in diesem 
Buch bevorzugt behandelt. 

Die ersten drei Kapitel des Buches stellen im wesentlichen eine Einführung dar, 
um einen Einblick in die Anwendbarkeit und die numerischen Besonderheiten der 
Methode zu geben. Einen zentralen Platz nimmt das vierte Kapitel ein, in dem 
Methoden zur Integralberechnung betrachtet werden. In den Kapiteln V und VI 
deren Inhalt sich unmittelbar an die Ausführungen von Kapitel IV anschließt, 
und in den weiteren Kapiteln bis einschließlich Kapitel VII wird von der Möglich- 
keit Gebrauch gemacht, eine Folge von Realisierungen einer gleichverteilten 
Zufallsgröße zu finden. Erst im siebenten Kapitel wird diese Frage ausführlicher 
erörtert. 

Es ist natürlich, daß die speziellen Interessen des Verfassers Einfluß auf die Stoff- 
auswahl hatten. Das Buch ist daher keinesfalls eine erschöpfende Abhandlung 
über die Monte-Carlo-Methode. Eine Reihe von Fragen wird nur flüchtig berührt, 
und ein Teil des Stoffes hat mehr den Charakter einer Übersicht. Der Autor hofft 
aber, daß Fragen im Zusammenhang mit der Rolle der statistischen Theorie der 
Schätzungen und die Aufgabe der Dispersionsverkleinerung genügend vollständig 
behandelt wurden, obwohl die schnelle Entwicklung von Arbeiten in dieser Rich- 
tung die letzte Behauptung etwas einschränkt. So können die Materialien der 
2. Allunionskonferenz zu Monte-Carlo-Methoden, die stattfand, als das Buch im 
wesentlichen schon fertig geschrieben war, als nützliche Ergänzung zu einzelnen 
seiner Abschnitte dienen. 

Der $4 des vierten Kapitels wurde gemeinsam mit B. L. GrRAnowsKkI verfaßt. 
Diskussionen mit G. A. MıcHArow, I. M.SogoL, N. N. TscHhexzow haben 
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wesentlichen Einfluß auf die Bearbeitung vieler Probleme der Monte-Carlo-Methode 
durch den Autor gehabt. 

Der Autor ist den genannten Personen und im Besonderen N. N. TscHENZoWw, 
dessen Bemerkungen zur Beseitigung einer Reihe von Fehlern im Manuskript 
führten, zutiefst dankbar. 

Der Autor dankt auch J. W. Link und G. IT. MARTSCHUK, die den Autor wäh- 
rend seiner Ausbildung auf den Themenkreis gelenkt haben, der in diesem Buch 


zur Darstellung gelangt. 
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I. EINFÜHRUNG 


$1. Einführende und historische Bemerkungen 


Die Monte-Carlo-Methode kann definiert werden als Methode zur Modellierung 
von Zufallsgrößen mit dem Ziel, spezielle Eigenschaften ihrer Verteilungen zu 
berechnen. In der Regel wird angenommen, daß die Modellierung auf elektroni- 
schen Datenverarbeitungsanlagen (EDVA) verwirklicht wird, obwohl man in 
einigen Fällen schon bei der Benutzung solcher Hilfsmittel wie Roulettespiel, 
Bleistift und Papier Erfolg haben kann. 


Die erste Idee zur Ausnutzung zufälliger Erscheinungen auf dem Gebiet der 
numerischen Rechnungen stammt aus dem Jahre 1878, als die Arbeit von Haut [1] 
über die Bestimmung der Zahl x durch zufälliges Werfen einer Nadel auf parallel 
liniertes Papier erschien. Diese Aufgabe ist allgemein bekannt, und ihre Beschrei- 

bung kann man in Büchern der Wahrscheinlichkeitstheorie finden (z.B. bei 
ProcHorow und Rosanow [1], S.17). Das Wesen der Sache besteht darin, daß 
man experimentell Ergebnisse nachbildet, deren Wahrscheinlichkeit durch die 
Zahl x ausgedrückt wird, und daß man diese Wahrscheinlichkeit näherungsweise 
abschätzen kann. Obwohl sich analoge Überlegungen in bezug auf andere Aufgaben 
in einer Reihe späterer Arbeiten finden (vgl. dazu HammersLey und HAnDscomB 
[1]), enthalten sie doch noch keine bemerkenswerte Entwicklung. Erst im Jahre 
1944, als im Zusammenhang mit Arbeiten an dem Atombombenprojekt JoHN 
von NEUMANN vorschlug, den Apparat der Wahrscheinlichkeitstheorie für die 
Lösung angewandter Aufgaben mit Hilfe der EDV auszunutzen, begann die eigent- 
liche Entwicklung der Monte-Carlo-Meihode. Die erste Arbeit, die solche Probleme 
systematisch darstellte, ist die von METROPOLIS und Uran [1]. 


Arbeiten sowjetischer Wissenschaftler zur Monte-Carlo-Methode erscheinen seit 
1955/56. Innerhalb von zwei Jahrzehnten entstand eine umfangreiche Biblio- 
graphie zur Monte-Carlo-Methode, die mehr als 2000 Titel umfaßt. Dabei zeigt 
bereits ein flüchtiger Blick auf die Titel der Arbeiten die Brauchbarkeit der Monte- 
Carlo-Methode zur Lösung angewandter Aufgaben aus verschiedenen Gebieten von 
Wissenschaft und Technik. 


Ursprünglich wurde die Monte-Carlo-Methode hauptsächlich zur Lösung von 
Aufgaben der Neutronenphysik benutzt, bei denen die traditionellen numerischen 
Methoden wenig brauchbar sind. Weiter erstreckte sich ihr Einfluß auf eine große 
Klasse von Aufgaben der statistischen Physik, die ihrem Inhalt nach sehr ver- 
schieden sind. Zu Wissenschaftszweigen, die in besonders großem Maß die Monte- 
Carlo-Methode benutzen, muß man u.a. die Bedienungstheorie, die Spieltheorie 
und mathematische Ökonomie und die Theorie der Nachrichtenübertragung beim 
Vorhandensein von Störungen zählen. 
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Die Monte-Carlo-Methode übte bisher und übt noch jetzt einen wesentlichen 
Einfluß auf die Entwicklung von Methoden der numerischen Mathematik aus 
(z. B. Entwicklung von numerischen Integrationsverfahren). Bei der Lösung vieler 
Aufgaben läßt sie sich erfolgreich mit anderen numerischen Verfahren verbinden 
und ergänzt diese. Ihre Anwendung ist in erster Linie bei solchen Aufgaben gerecht- 
fertigt, die eine wahrscheinlichkeitstheoretische Beschreibung gestatten. Das ist 
erklärlich, da die Antwort bei Aufgaben mit stochastischem Inhalt mit einer ge- 
wissen Wahrscheinlichkeit gegeben wird und sich außerdem die Lösungsprozedur 
bei der Monte-Carlo-Methode wesentlich vereinfacht. Die Schwierigkeit bei der 
Lösung dieser oder jener Aufgabe auf einer EDVA entsteht in bedeutendem Maß 
durch Schwierigkeiten bei der Übersetzung in die Maschinensprache. Die Schaffung 
der Programmiersprachen vereinfachte eine Etappe dieser Arbeit wesentlich. Die 
kompliziertesten Etappen sind daher gegenwärtig die mathematische Beschreibung 
der zu untersuchenden Erscheinung, die notwendige Vereinfachung der Aufgabe, 
die Auswahl der geeigneten numerischen Methode, die Untersuchung der dabei 
auftretenden Fehler und das Aufstellen des Algorithmus. In den Fällen, in denen 
es eine wahrscheinlichkeitstheoretische Beschreibung der Aufgabe gibt, kann die 
Benutzung der Monte-Carlo-Methode die genannten einzelnen Etappen wesentlich 
vereinfachen. Wie sich im Weiteren herausstellen wird, ist es übrigens in vielen 
Fällen nützlich, auch für streng deterministische Aufgaben ein stochastisches Modell 
zu konstruieren (randomisieren der Aufgabe), damit dann die Monte-Carlo-Methode 
benutzt werden kann. 

Obgleich eine Definition der Monte-Carlo-Methode hier gegeben wurde, wird der 
Inhalt dieser Methode, wie gewöhnlich, erst durch die weiteren Ausführungen 
völlig klar. Wir verwenden hier immer die Bezeichnung ‚„Monte-Carlo-Methode‘‘, 
die mit der Bezeichnung ‚Methode der statistischen Versuche‘ gleichbedeutend ist, 
und auch in der sowjetischen Literatur gebräuchlich ist. In der nichtsowjetischen 
Literatur spricht man gewöhnlich dann von der Monte-Carlo-Methode, wenn man 
von der Vorstellung ausgeht, daß die der Berechnung zugrunde liegenden Größen 
von verschiedenen stochastischen Modellen ausgehend geschätzt werden können 
(z. B. können Zufallsgrößen mit verschiedenem Verteilungsgesetz den gleichen 
Mittelwert haben). Im folgenden bietet es sich aber an, von verschiedenen Modellen 
und ihren Transformationen im Rahmen einer Methode zu sprechen. Oft, wenn 
vom Studium irgendeiner realen Erscheinung die Rede ist, bezeichnet man die 
Modellierung durch Zufallsgrößen als ‚Simulation‘ (russ. umnTtauun). 

Wir werden die Bezeichnung ‚Simulation‘ manchmal auch gebrauchen, um die 
Verbindung des entsprechenden Modeils mit gewissen realen Erscheinungen zu 

. unterstreichen, obwohl die Schaffung des stochastischen Modells einer Erscheinung 
notwendigerweise der Modellierung vorangeht, und es erhebt sich dann die Frage 
nach einer mehr oder weniger präzisen Beschreibung. 


$2. Einige Definitionen und Fakten aus der Wahrscheinlichkeitstheorie 


In diesem Paragraphen und in dem gesamten Kapitel werden die weiterhin not- 
wendigen Hilfsmittel bereitgestellt und wird eine Einführung in die Wahrschein- 
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lichkeitstheorie und die mathematische Statistik gegeben. Es sind verhältnis- 
mäßig wenig Begriffe und Fakten aus diesen Gebieten, die im folgenden benötigt 
werden, weil man vollkommen ohne den analytischen Apparat der Wahrschein- 
lichkeitstheorie auskommt. Die grundlegenden Definitionen werden zur Bequem- 
lichkeit des Lesers anschließend formuliert. Deren ausführliche Darstellung 
würde das Buch unvermeidlich in eine Abhandlung über Wahrscheinlichkeits- 
theorie und mathematische Statistik verwandeln und vom eigentlichen Ziel ab- 
lenken. Daher werden nur solche Fakten ohne Beweis formuliert, die große Be- 
deutung für das im Weiteren Dargestellte haben oder verhältnismäßig selten in 
der üblichen Literatur anzutreffen sind. 


1. Wahrscheinliehkeitsräume. Wie üblich gehen wir von einem Wahrscheinlich- 
keitsraum (2, X, P) aus, wobei 


1. 2 eine gegebene Menge ist, genannt Raum der Elementarereignisse; seine 
Elemente werden auch als Punkte bezeichnet; 


2. X eine nichtleere Menge von Untermengen von 2 ist, die eine o-Algebra 
darstellt, d.h. abgeschlossen ist bezüglich der Summe (Vereinigung) abzählbar 
vieler Mengen sowie des Durchschnitts und der Komplementbildung; voraus- 
gesetzt, daß 2 (und folglich auch die leere Menge) Elemente von W sind; 


3. P ein Wahrscheinlichkeitsmaß ist, d.h. eine nichtnegative Funktion über W 
mit P(2) = 1 und 


(34) - Ep 


wenn die A; eine Folge von paarweise durchschnittsfremden Mengen aus U sind. 
Außer den Wahrscheinlichkeitsmaßen werden oft auch endliche Maße it betrachtet, 
die sich vom Wahrscheinlichkeitsmaß durch eine andere Normierung &(2) = const 
<oo unterscheiden, und o-endliche Maße u, für die «(2) unendlich sein kann, 
aber der ganze Raum 2 eine Darstellung als Summe abzählbar vieler Mengen 4, 
mit endlichem Maß v(A)< w,i=1,2, ...., gestattet. 

Das übliche Vorgehen bei Definitionen eines Maßes auf einer o-Algebra besteht 
darin, daß das Maß zunächst nur auf einer engeren Gesamtheit von Mengen de- 
finiert wird, und zwar auf einem Halbring, und danach auf die den Halbring um- 
fassende o-Algebra ausgedehnt wird. Eine Gesamtheit A von Mengen heißt 
Halbring, wenn mit zwei beliebigen Mengen aus A auch der Durchschnitt zu A 
gehört. Dabei kann eine beliebige Menge aus A als Summe von höchstens ab- 
zählbar vielen durchschnittsfremden Mengen A,, As, Az, ... dargestellt werden. 
Insbesondere ist ganz 2 darstellbar in der Form Q= UA, Es existiert eine 


t 
minimale o-Algebra, die den gegebenen Halbring A umfaßt, d. h. eine solche, die 
im Durchschnitt aller A umfassenden o-Algebren enthalten ist. 
Ist A e X eine beliebige Menge aus W und gilt AC L J A, wobei alle A, aus A 
sind, so erhält man durch 


nA) = inf Z u(A,) 


2 Ermakow, Monte-Carlo-Methode 
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eine Fortsetzung des Maßes u vom Halbring A auf die o-Algebra X. Dabei ist 
das Infimum bezüglich jeder möglichen Auswahl von abzählbar vielen Mengen 4; 
aus A zu bestimmen. Eine solche Fortsetzung eines o-endlichen Maßes auf die 
o-Algebra X ist in eindeutiger Weise möglich. 

Als einfachstes Beispiel eines Halbrings kann die Gesamtheit aller halboffenen 
Intervalle (x’, x’’] der reellen Achse dienen. Die minimale o-Algebra, die den 
Halbring dieser Intervalle umfaßt, trägt den Namen o-Algebra der Borelschen 
Mengen der Zahlengeraden. Das Maß auf dem Halbring der Intervalle kann durch 
die Gleichung 


P((x’,2”))) = Fe”) — F(x’) 


gegeben sein, wobei F(x) eine beliebige, auf — © < x <{ -+ oo definierte, nicht- 
negative, rechtsseitig stetige, monoton nichtfallende Funktion ist mit 

lim F(x) = 0 und lm F(x) =1. 

> —-80 >+%0 
Jede Funktion mit den aufgezählten Eigenschaften definiert ein Wahrscheinlich- 
keitsmaß auf den Borelschen Mengen der Zahlengeraden. Weiter wird häufig 
als Raum 2 der s-dimensionale euklidische Raum (s kann auch unendlich sein) 
oder ein linearer normierter Funktionenraum vorkommen, und es wird die durch 
den Halbring der offenen Menge dieser Räume erzeugte o-Algebra betrachtet 
Eine solche o-Algebra trägt auch die Bezeichnung o-Algebra der Borelschen Mengen, 
und ihre Elemente heißen Borelsche Mengen. 

Sind (2, ,P,) und (2, W,, P,) zwei Wahrscheinlichkeitsräume, so ist das 

direkte (kartesische) Produkt 2,x 2, die Menge aller geordneten Paare (w,, 3); 
@,€ R,, ®g€ Q,. Wir definieren das Produkt der o-Algebren 


yxa2 — ÜXxX U, 


als die kleinste o-Algebra, die den Halbring aller möglichen Rechteckmengen der 
Art A, X Ay (A, € U, Ag € W,) umfaßt. Das Maß auf diesem Halbring kann durch 
P(A,, A,) = P,(A,) - Pa(A,) : 
definiert und auf die o-Algebra A? erweitert werden. Ein auf diese Weise be- 
stimmtes Maß P, x P, trägt die Bezeichnung Produkt der MaßeP, und P,. Der 
Wahrscheinlichkeitsraum (2, x 2, U x W, Pı X P,) wird Produkt der Räume 
(2), X, Pı) und (2,, X, P,) genannt. Das Produkt einer beliebigen Anzahl von 
Wahrscheinlichkeitsräumen kann dann durch Induktion definiert werden. 


2. Meßbare Funktionen, Integral, Ableitung. Nach Einführung eines Maßes auf 
einer o-Algebra ist es ohne weiteres möglich, den Begriff des Integrals einer meß- 
baren reellen Funktion auf dem Raum 2 zu definieren. Das geschieht völlig 
analog zur Definition des Lebesgueschen Integrals. 

Die Funktion &w) (» € 2) heißt A-meßbar (oder einfach meßbar, wenn es klar 
ist, welche o-Algebra gemeint ist), wenn die Menge {» : &(@) <“ x} für jede reelle 
Zahl x zu U gehört. Eine meßbare Funktion heißt einfach, wenn sie auf 2 nicht 
mehr als abzählbar viele verschiedene Werte annimmt. Wenn die Menge {o:£(@®) 
<x} für alle x eine Borelmenge ist, was wir in der Regel voraussetzen, so heißt 
E(w) eine Borelfunktion. Die Klasse der Borelfunktionen fällt zusammen mit der 
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Klasse der Baireschen Funktionen, falls 2 ein linearer normierter Raum R ist. 
Dabei enthält die Klasse der Baireschen Funktionen alle Funktionen auf R, die 
sich als Grenzwert einer bezüglich der Metrik von R konvergenten Folge stetiger 
Funktionen darstellen lassen. 

Nun sei A, eine Folge durchschnittsfremder Mengen, auf denen die einfache 
Funktion n(®) konstante Werte 7; hat. Man kann zeigen, daß dieseMengen meßbar 


co 
sind. (m) heißt integrierbar, wenn die Reihe 3) nıl'P(A;) konvergiert, und die 
Größe I-1 


/ no) Pdo) = FE nıP(A,) 
a dl 


heißt Integral der einfachen Funktion 7 über dem Raum 2. Eine beliebige meß- 
bare Funktion &(o) kann für fast alle » als Grenzwert einer konvergenten Folge 
einfacher Funktionen dargestellt werden, d. h., mit Ausnahme einer Menge vom 
Maß Null gilt 


E(o) = lim 720) (oe 2 (mod P)). 


Hier und weiterhin wird die Bezeichnung (mod P) gebraucht, wenn eine Eigen- 
schaft für alle Elemente einer Menge mit Ausnahme einer Menge vom P-Maß 
Null erfüllt ist (P Wahrscheinlichkeitsmaß oder o-endliches Maß). In diesem Fall 
sagen wir gewöhnlich, daß die Eigenschaft für fast alle » bezüglich des Maßes P 


gilt oder mit der Wahrscheinlichkeit 1 gilt, wenn P ein Wahrscheinlichkeitsmaß ist. 


Alle Funktionen, für die die obere Grenze 
sup S Inlo)| P(dw) 
n 2 
bezüglich aller einfachen Funktionen n mit |n| < ]&| endlich ist, heißen integrierbar. 
Das Integral / &(o) P(do) wird als Grenzwert von Integralen solcher einfacher 
fe 


e} & 
Funktionen 7, definiert, daß 7„(») für fast alle ® für n — oo gegen &(w) strebt 
und |». S lE| gilt. Das Integral über eine beliebige Menge A aus W existiert, 
wenn die Funktion &p , integrierbar ist. Dabei ist @, die charakteristische Funktion 
der Menge A, also 


o4lw) = k 
Dann ist 
J &o) P(dw) = Fo) p.4lo) P(dov) . 


für weA, 
für weA. 


Für das auf diese Weise definierte Integral sind die üblichen Eigenschaften des 
Lebesgueschen Integrals über ein endliches Intervall gültig, was wir im weiteren 
ohne nähere Begründung unter Hinweis auf entsprechende Literatur benutzen 
werden. 


Wenn ein o-endliches Maß u(4) (4 e X) die Darstellung 
u(A) =//o) P(do) (1.2.1) 
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gestattet, wobei f eine nichtnegative integrierbare Funktion ist, so heißt f(®) die 
Radon-Nikodymsche Ableitung des Maßes u nach dem MaßP, und man gebraucht 
die Schreibweise 


n 
flo) = = (w). (1.2.2) 


Nach dem Satz von RapoN-NIKODYM existiert die Ableitung f(») für gegebene 
o-endliche Maße x und P,d. h., es gibt eine Darstellung (1.2.1) genau dann, wenn 
4 absolut stetig in bezug auf P ist («a <P), d. h., aus der Gleichung P(A) = 0, 
(A e A) folgt aA) = 9. 


3. Zufallsgrößen und Verteilungsfunktionen. Es sei (2, X, P) ein Wahrschein- 
lichkeitsraum. Die Mengen A aus W heißen Ereignisse und die Größen P(A) ihre 
Wahrscheinlichkeiten. 

Eine beliebige A-meßbare reelle Funktion &(w), die fast überall endliche Werte 
annimmt, heißt eine auf 2 definierte Zufallsgröße. Zufallsgrößen, die sich nur 
auf einer Menge vom Maß Null unterscheiden, werden als gleich betrachtet. 

Für jede Zufallsgröße &(w) ist eindeutig die Verteilungsfunktion 

Fix) = P(o : &o) < «) (1.2.3) 
definiert, die eine monoton nichtfallende, nichtnegative, linksseitig stetige Funk- 
tion mit 

lim Fe) = 0, lim Fix) = 1 
darstellt. Wie früher gezeigt wurde, wird mit Hilfe von F:(x) eindeutig das 
Wahrscheinlichkeitsmaß P auf den Borelmengen der Zahlengeraden bestimmt. 
Dieses Maß nennt man auch die Verteilung der Zufallsgröße &o). Wenn = 
— (&,,...,&,) eine Gesamtheit von auf (2, W,P) definierten Zufallsgrößen, also 
einen Zufallsvektor, darstellt, so heißt die Funktion 


Fzla,,..,%) = e( N wo: lo) < 2) 
i=1 


gemeinsame Verteilungsfunktion der Zufallsgrößen &, ..., &, oder Verteilungsfunktion 
des Zufallsvektors Z. Sie ist eindeutig bestimmt im s-dimensionalen euklidischen 
Raum, monoton nicht fallend und linksseitig stetig in jeder Variablen. Außerdem 
gilt 

lim Fız,.,2)=0, k=l1,..,8, 


5 zu (&1 “... &,) 3 


so daß Fa,(&,...,%) eine Verteilungsfunktion des Zufallsvektors I, darstellt. 
Mit Hilfe der Funktion Fs(z,, ..., x,) Kann unter einigen zusätzlichen Bedingungen 
(vgl. PrRocHoRow und Rosanow [1]) auch das Maß auf den Borelmengen des 
s-dimensionalen euklidischen Raumes definiert werden. 
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Wenn das Integral 
F&o) P(do) = S @dPxle) 


existiert, so nennt man dessen Wert den Erwartungswert (mathematische Erwartung) 
der Zufallsgröße £ und bezeichnet ihn mit M&. Wenn das Wahrscheinlichkeits- 
maßP absolut stetig in bezug auf das o-endliche Maß « ist, so nennt man die 


Radon-Nikodymsche Ableitung . (w) die Verteilungsdichte von P bezüglich u. 
u 


Wenn insbesondere u das Lebesguesche Maß ist und fast überall die gewöhnliche 
Ableitung N 

dx 
oder Wahrscheinlichkeitsdichte der Zufallsgröße &. Für mehrdimensionale Zufalls- 
größen wird die Dichte der gemeinsamen Verteilung durch die Gleichung 


sl) 


er 


dx, 0%, 


= pe) existiert, so heißt diese einfach die Verteilungsdichte 


Pzltı: »-., %,) 


für fast alle x, ..., x, definiert. 


Mit Hilfe des früher eingeführten Begriffs des Integrals über einer Menge A 
aus X können die bedingte Wahrscheinlichkeit und der bedingte Erwartungswert 
definiert werden. Es sei ® eine in V enthaltene o-Algebra. Bedingter Erwartungs- 
wert M(£|B) der Zufallsgröße & bezüglich ® heißt jede B-meßbare Funktion, die 
für beliebige B aus B der Gleichung 


jo) P(do) = /M(EI®) P(do) 


genügt. Unter Benutzung des Satzes von RApDon-NIıkopyM kann man zeigen, 
daß eine solche Funktion bis auf eine Menge vom Maß Null immer existiert und 
eindeutig bestimmt ist. Als bedingte Wahrscheinlichkeit P(B|B) eines Ereig- 
nisses Be B bezüglich der o-Algebra B wird die Funktion M(p;|B®), wobei @5 
die charakteristische Funktion von B ist, bezeichnet. Diese ist ®-meßbar und 
für beliebige A € B gilt, mit Ausnahme einer Menge vom Maß Null, die Gleichung 


P(An B) =/PBI®) P(dw) , 


die auch zur Definition der bedingten Wahrscheinlichkeit dienen kann. In dem 
von uns betrachteten Fall, daß die Zufallsgröße reelle Werte aus (—co, +0) 
annimmt, gibt es unter den die bedingte Wahrscheinlichkeit definierenden äqui- 
valenten Funktionenmengen eine solche, die Eigenschaften wie ein Wahrschein- 
lichkeitsmaß hat. Das erlaubt es (mit der Wahrscheinlichkeit 1), eine bedingte 
Verteilungsfunktion zu definieren: 


Fr@|B) = Pia :5<ald). 

Es sei U eine Menge mit einer bestimmten o-Algebra ihrer Teilmengen & (meß- 
barer Raum), und die Funktion g soll eine meßbare Abbildung 2 — U definieren. 
Als bedingter Erwartungswert (bzw. bedingte Wahrscheinlichkeit) bezüglich der 
Funktion g wird der bedingte Erwartungswert (bzw. die bedingte Wahrschein- 
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lichkeit) in bezug auf die o-Algebra g”!& bezeichnet. Analog wird für eine Familie 
von Funktionen g; @ =], ..., n) mit Werten in meßbaren Räumen €; der bedingte 
Erwartungswert M(£|g,; ---, 9») definiert als bedingter Erwartungswert bezüglich 
der minimalen o-Algebra, die alle g;'&; umfaßt. Wie oben kann der Begriff der 
bedingten Verteilungsfunktion bezüglich einer gegebenen Funktion oder eines 
Funktionensystems eingeführt werden. 


4. Momente von Zufallsgrößen, das Gesetz der großen Zahlen und der zentrale 
Grenzwertsatz. Existiert die Größe ME’, r > 0, so heißt sie r-tes Moment der 
Zufallsgröße £. Die Größe M(& — M£)" heißt r-tes zentrales Moment. Das zweite 
zentrale Moment DE = M(£ — M£)? wird Dispersion genannt. 

Eine wiehtige Rolle werden im weiteren die zweiten zentralen Momente der 
Komponenten des Zufallsvektors spielen, die Dispersionen 


D&, = M(&, — M£ı)? 

und die Kovarianz 
coV(&r, &) = Ml(&r — Möı) (& — MS], kl, 
cov(&,&) = DE. 


Die Matrix 2 = ||cov(&,, &,)||r,1=1,..,, nennt man Kovarianzmatrix. 

Mit den zweiten Momenten einer Zufallsgröße ist die Normalverteilung eng 
verbunden. Eine Zufallsgröße & heißt normalverteili auf (—o, ©), wenn sie 
die Verteilungsfunktion 


® (=) — (Ara) fe-te-ari2 de (1.2.4) 
besitzt, wobei a =M£ und o®=D&£ ist. Der Zufallsvektor 2 = (£,, ..., &,) heißt 
im s-dimensionalen Raum normalverteilt, wenn für seine Dichte 

Palkı ++, 2%) = (2) 2 (det DJ 2 exp (— +E'D1&) (1.2.5) 


gilt. Dabei ist & ein Spaltenvektor mit den Komponenten x, — 4, +.., % — Ay 
a; = M£,, und D ist die Kovarianzmatrix des Vektors&. 


Die Möglichkeit, eine Aufgabe mit der Monte-Carlo-Methode zu lösen, findet 
gewöhnlich ihre Begründung im Gesetz der großen Zahlen für unabhängige Zufalls- 
größen. Es seien &,,...,&, unabhängige Zufallsgrößen mit gleicher Verteilung. 
Wir nehmen an, daß 


ME, = a< © und DE, = 0?< (k=1,..., n) 


n 
existieren, und setzen $,„= }) &. Für beliebiges & > 0 gilt dann die T'scheby- 
k=1 
scheffsche Ungleichung 


0? 
<.) 21 (1.2.6) 
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oder anders .. 


m 


Daraus folgt unter den genannten Voraussetzungen die einfachste Variante des 
Gesetzes der großen Zahlen. Für beliebiges e > 0 und ö > O und genügend großes 
n unterscheidet sich das arithmetische Mittel S,/n mit einer Wahrscheinlichkeit 
die nicht kleiner als 1 — ö ist, von a um höchstens den Wert e. Tatsächlich gilt 
das Gesetz der großen Zahlen noch unter wesentlich schwächeren Voraussetzungen. 
Insbesondere behauptet das Gesetz der großen Zahlen in der Form von CHINTScHIN 
(FELter [1]), daß 


P | SE a, >.) —0 

ie | n—>00 
gilt, falls nur die Zufallsgröße £ einen endlichen Erwartungswert besitzt. Daher 
konvergiert das arithmetische Mittel 8,/n unter sehr allgemeinen Voraussetzungen 
der Wahrscheinlichkeit nach gegen den Erwartungswert. Ist die Dispersion D£, 
unendlich, so verlieren die Ungleichungen (1.2.6) ihren Sinn, aber es gilt noch 
die Ungleichung (vov BAHR und Esszgex [1]) 


MS» 
M——a 
Rn 


ne: 


Sn _ « > .)< (1.2.7) 


r 2 n 
Sez M&,—a’, 1£rs2, (1.2.8) 


wenn die &, unabhängige Zufallsgrößen mit nicht notwendig identischer Ver- 
teilung, aber dem gleichen Erwartungswert a sind. Im allgemeinen Fall kann 
die Konstante in (1.2.8) nicht verbessert werden. Schließlich werden wir im 
weiteren das starke Gesetz der großen Zahlen benutzen, in dem behauptet wird, 
daß das arithmetische Mittel S,„/r unabhängiger identisch verteilter Zufallsgrößen 
gegen ihren Erwartungswert mit der Wahrscheinlichkeit 1 konvergiert. 

Für uns ist nicht nur die Konvergenz der Größe S„/n gegen den Erwartungswert 
von Interesse, sondern auch die Verteilung von $„/n. Ist 0? < oo und existiert 
das dritte Moment ß, = MI£, — a]? < ©, so besagt der zentrale Grenzwertsatz, 
daß S,„/n asymptotisch normalverteilt ist mit der Dispersion o?/n und dem Er- 
wartungswert a. Es gilt dabei die Ungleichung 


= e-wi2 aus ae Sobr (1.2.9) 


P(S„ — an >o na) — 2y ’ 
n 


at 


wobei c, eine positive Konstante mit der (bis jetzt bekannten) Abschätzung 


1/y2r <c,< 0,9051 ist. Isracımow und Lissık [1] haben hinreichende und 
notwendige Bedingungen dafür angegeben, daß die Konvergenz gegen die Normal- 
verteilung von der Ordnung o(n-!?) erfolgt. Im allgemeinen Fall sind die Grenz- 
verteilungen des arithmetischen Mittels unabhängiger Zufallsgrößen sogenannte 
stabile Verteilungen, wie sie ausführlich von GnEDENKo und KoLMoGoRoFF [1] 
betrachtet wurden. Wir werden nicht auf ihre Eigenschaften eingehen, weil sie 
bis jetzt verhältnismäßig selten in der Monte-Carlo-Methode Anwendung finden, 
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5. Zufällige Prozesse. Der Begriff des Zufallsprozesses (stochastischer Prozeß) 
ist eine unmittelbare Verallgemeinerung des Begriffs Zufallsgröße. Es sei 9 ein 
Parameter, der Werte aus der Menge ® annimmt. Die Funktion &(#, o), die als 
Funktion von # auf ® und als Funktion von » auf dem Wahrscheinlichkeitsraum 
(2, %, P) definiert ist, ist für jeden festen Wert 9 aus © eine Zufallsgröße &(o) 
und wird Zufallsprozeß genannt. Gewöhnlich wird vorausgesetzt, daß © die Menge 
der reellen Zahlen ist. Ist © eine Menge komplizierterer Art, so heißt &(®, ») eine 
Zufallsfunktion oder ein Zufallsfeld. 

Alle möglichen gemeinsamen Verteilungen der Zufallsgrößen &(9;, ©), ..., &(9@) 
nennt man endlichdimensionale Verteilungen des Zufallsprozesses. 

Nach dem Satz von KoLMoGororr [1] existiert für jede Menge von Funktionen 
Fly, 915... 94), die bei beliebigen festen rn und #,,..., d, als Verteilungs- 
funktionen erscheinen, ein Wahrscheinlichkeitsraum (2, X,P) und eine Familie 
meßbarer Funktionen &(9, o), &e 2, derart, daß 


Fol, Oi e;  du) = PlEIO,, 0) S 9; 5 Ed @) Sau) 
gilt, wenn die Verträglichkeitsbedingung 


lim Fl D; 5 Us d) = Fn-1(%,, 9; u, ün—1s ®n-ı) 

m>X 5 
erfüllt ist. Auf diese Weise kann ein Zufallsprozeß durch eine Funktion F', für 
alle möglichen » definiert sein. 


Eine Funktion des Parameters d, die für jedes feste 9 gleich M&(d, &) ist, heißt 
Erwartungswert oder Mittelwert des Zufallsprozesses, und eine Funktion zweier 
Veränderlicher 


R(d, t) = M(£(8, ©) £(t, ©)) 
heißt Kovarianzfunktion. Unten werden wichtige Sonderfälle von Zufallsprozessen 
betrachtet. Die Prozesse werden dabei im engeren Sinn definiert (vgl. Doosg [1]). 


Ein Zufallsprozeß &(9) = £(d, ®) heißt stationär, wenn die mit ihm verbundene 
Wahrscheinlichkeitsverteilung invariant gegenüber Verschiebungen des Para- 
meters © ist. Sind alle endlichdimensionalen Verteilungen des Prozesses Normal- 
verteilungen, so spricht man von einem Gaußschen Prozeß. 


Ein Prozeß heißt Markoffscher Prozeß, wenn für seine bedingten endlichdimen- 
sionalen Verteilungen mit der Wahrscheinlichkeit 1 die Gleichungen 
P(&8) < alEdı), -- &dn-ı)) = PlER.) < zlE(dn-ı)) (1.2.10) 
bei beliebigen Parameterwerten 9, < --- <d, aus © erfüllt sind. 


Die Bedingung (1.2.10) ist der folgenden äquivalent: Für beliebige t, < t, aus 
© und jedes x gilt mit der Wahrscheinlichkeit 1 


P(&) S zlöl, St) = Pe) Salclh)) (1.2.11) 


Ein Markoffscher Prozeß ist also gegeben durch die Übergangswahrscheinlichkeit 
und die Anfangsverteilung. Es wird in diesem Fall vorausgesetzt, daß © ein 
minimales Element 9, hat, für das die Anfangsverteilung z der Zufallsgröße &(9,) 
gegeben ist, und daß die Funktion (Übergangswahrscheinlichkeit) P(w,t; ©',®); 
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o,w’eQ,t,9ec0©, für fast alle » der Gleichung von CHAPMAN-KOLMOGOROFF 
P(w,t;0',9) = f P(o”,t;w’, ®) P(w, £; do”, r) 


genügt. Diese Gleichung sichert, daß die Verträglichkeitsbedingungen der endlich- 
dimensionalen Verteilungen des Prozesses erfüllt sind. 

Es sei & ein stationärer Markoffscher Prozeß, also P(w, t; 0’, #) — P(w, »’), und 
s die charakteristische Funktion der Borelschen Menge Be %. Für beliebige 
W<d<<d, wird die gemeinsame Verteilung der Zufallsgrößen &, = 
— (U @)s +. &n = &(9, @) durch den Ausdruck 


S atdE,) S PlEo E81) S PoPlin-ı, dEn) ' . (1.2.12) 
definiert. 

Ein wichtiger Sonderfall des Markoffschen Prozesses ist die Markoifsche Kette 
mit einer endlichen Anzahl von Zuständen m. In diesem Fall kann die Funktion 
&(d, o) nur endlich viele Werte annehmen. Im stationären Fall wird die Kette 
für 9 = d, durch eine diskrete Anfangsverteilung beschrieben. Die Rolle der 
Übergangswahrscheinlichkeit spielt hier die Übergangsmatrix (stochastische Ma- 
trix 

P = |Ipi,sllisz..., 
m 
deren Elemente den rn Piz a Pi; = 1 genügen. 


Im wesentlichen werden wir in den tolgenden Kapiteln nur Markoffsche Pro- 
zesse oder sogar nur ihren Sonderfall, die Markoffschen Ketten, mit endlich oder 
abzählbar unendlich vielen Zuständen betrachten. Als einzige Ausnahme er- 
scheint der (eindimensionale) Prozeß der Brownschen Bewegung, der eine un- 
mittelbare Beziehung zur Lösung der Wärmeleitungsgleichung hat. Der Prozeß 
der Brownschen Bewegung, der ein Gaußscher Prozeß ist, ist eng verknüpft mit 
dem Wienerschen Maß und dem Wienerschen Integral, deren exakte Einführung 
‚recht kompliziert ist. Wir beschränken uns daher nur auf eine Erläuterung dieser 
Begriffe. Die ausführliche formale Darstellung findet der Leser in einer Reihe von 
Lehrbüchern (z. B. SchıLow und Fan Dyk Tıs& [1]). In dem Buch von Kac [1] 
ist eine ausgezeichnete Darstellung der Anwendungen enthalten, die das Wiener- 
sche Maß und Integral in der Physik finden. 

Wie schon aus der Bezeichnung folgt, ist der Prozeß der Brownschen Bewegung 
eng mit der Brownschen Bewegung von Teilchen verbunden. Wenn ein Teilchen 
die Bewegung zur Zeit t = 0 im Punkt x = 0 beginnt, so ist die Wahrscheinlich- 
keit dafür, daß es sich zu den Zeitpunkten 0 <t <t,< .- < t„ jeweils in den 
Intervallen [a,, b,]; ..-, [@n, 5„] befindet, durch die Formel 

bi m 
SS pl, 15h) Play ag, tat) Plan An; tn tn) day den (1.2.13) 
a, An 


mit 


1 
plz, y;t) = (Ant)? exp | g (Yy— 22 (1.2.14) 


gegeben. Wurde als Raum 2 der Raum der auf [0, ©) stetigen Funktionen x(f) 
mit = elb;) für i=1,...,n und x(0) = 0 gewählt, so definiert die Formel 
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(1.2.13) ein Wahrscheinlichkeitsmaß auf dem Halbring der Mengen von der Form 
[5 tt) S bi; 5,0, S et) S bu] 


(es ist leicht zu verifizieren, daß die Verträglichkeitsbedingungen erfüllt sind), 
und dieses kann auf den ganzen Raum 2 der stetigen Funktionen fortgesetzt 
werden. Entsprechend dem allgemeinen Schema bei der Einführung des Integrals 
kann nun weiter das Wienersche Integral definiert werden. 

Es sei f(x) eine stetige nichtnegative Funktion über ze (—x, +0). Das 
Wienersche Integral 


J= fexp [Fre a| P(do) (1.2.15) 


mit dem Wienerschen Maß P kann auch als Grenzwert 


J=lim fol 4 Ef) |»00 2,54) Planen 5in—enı) dry din 


betrachtet Ba den man mittels (1.2.14) folgendermaßen schreiben kann: 


J=lim (2rxin7!) ei fl [= [ers ER) lünı--dan 


n>+X i=1 In”! 


Das erlaubt, J in der Form 


t 
f exp| — Y 5 E) + Kan) dr | d (Trajektorie) 
N) 


zu schreiben. Im folgenden wird uns eine solche symbolische Form der Schreib- 
weise eines Integrals nützlich sein. Auf diese Weise werden im Fall des Prozesses 
der Brownschen Bewegung die Punkte des gewählten Raumes 2 mit den stetigen 
Funktionen identifiziert. 

Die Funktion &(9, &) heißt bei festem w Realisierung des Zufallsprozesses. Die 
Realisierungen eines Zufallsprozesses können als Elemente eines Funktionenraumes 
betrachtet werden. Unter bestimmten Bedingungen kann auch eine Metrik im 
Funktionenraum der Trajektorien eingeführt werden. Für die Feststellung der 
Stetigkeit der Trajektorien des Prozesses wird das Stetigkeitskriterium für Trajek- 
torien von KoLModoroFF für separable zufällige Prozesse benutzt. Wenn © der 
reellen Achse angehört und X ein gewisses System von Borelschen Mengen ist, so 
heißt der Prozeß & separabel bezüglich X, wenn es eine Folge %,, 9,, ... von Para- 
meterwerten und eine Menge Q,e 2 vom P-Maß Null derart gibt, daß sich mit 
Ace X und einem beliebigen offenen Intervall J die Mengen 


{n:Ed)e A,de TI} und {w : &(d,)e A, d, € I} 
untereinander nur um eine Teilmenge von 2, unterscheiden. Insbesondere ist 


der Prozeß der Brownschen Bewegung separabel. 
. Das Kriterium für die Stetigkeit der Trajektorien behauptet nun folgendes: 
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- Es sei &(9), de [a,b], ein separabler Zufallsprozeß, Wenn für gewisse 8 > 0, 
e>0 und 0<C< © und alle hinreichend kleinen 4% die Ungleichung 


MIE(B) — Ed + 49) Ss C1AH1'* 


gilt, so sind fast alle Realisierungen £ des Prozesses stetige Funktionen von 9. 
Es seien weiter &(t,, ©) = &,i = 1, 2...., die Realisierungen des Zufallsprozesses 
für = 1, Die Folge von Werten &; wird stationär genannt, wenn der zugrunde- 
liegende Prozeß stationär ist. Die Zufallsgrößen £, bilden abhängige Zufallsgrößen. 
Unter gewissen Voraussetzungen über die schwache Abhängigkeit der Zufalls- 
größen, die die stationäre Folge bilden, ist die Grenzverteilung des arithmetischen 
Mittels der £, stabil. Eine ausführliche Theorie zu dieser Frage kann man in der 
Monographie von IBRAGIMOW und Lissık [1] finden, in der auch Bedingungen 
formuliert werden, unter denen die Grenzverteilung eine Normalverteilung ist. 
Wir beschränken uns bei der Formulierung des Grenzwertsatzes nur auf den 
Sonderfall der k-abhängigen Zufallsgrößen. Die Zufallsgrößen ..., &_1 &» & -- 
einer stationären Folge heißen k-abhängig, wenn zufällige Vektoren der Art 
(Ey Earl + 80) und (Ep, Ep41r +, &p4+5) unabhängig sind, falls nur p—q >k 
ist. Setzt man 


= ME) +2 2 Mi, 
j= 
dann gilt im Fal0O<o?< 


= 
er"? du. (1.2.16) 
oyn i=1 Yy2r } 


—-—o 
Der entsprechende Grenzwertsatz für Markoffsche Ketten wird im sechsten Ka- 
pitel formuliert. Grenzwertsätze für abhängige Zufallsgrößen werden häufig in 
der Monte-Carlo-Methode benutzt. 


lim P( 


n>X 


1 1 
u) 


$3. Einige Erläuterungen zur mathematischen Statistik und das allgemeine 
Schema der Monte-Carlo-Methode 


1. Schätzung der Parameter von Verteilungen. Wie schon bemerkt, liegt in der 
Monte-Carlo-Methode der Konstruktion einer kompliziert verteilten Zufallsgröße 
eine auf dem Intervall [0, 1] gleichverteilte Zufallsgröße«x zugrunde. Mit anderen 
Worten, der zugrunde liegende Wahrscheinlichkeitsraum soll konstruktiv sein. 

Die Idee einer konstruktiven Aufgabenstellung geht zurück auf die Schöpfer 
der Theorie der Zufallsprozesse N. WIENER und P. Lfvy. In seinem Buch ‚‚Zu- 
fallsprozesse und Brownsche Bewegung‘ fordert P.L&vy [1], daß ein Prozeß 
modelliert werden kann, indem man von einer abzählbaren Folge von Zufalls- 
experimenten ausgeht, und er beschreibt eine Konstruktion solcher Art. Bereits 
früher wurde die Modellierung der Brownschen Bewegung von N. WIENER be- 
handelt (vgl. Parey und Wiener [1]). Die entsprechenden Algorithmen werden 
im zweiten Kapitel angeführt. 
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Im Anschluß daran wurde die Idee der konstruktiven Aufgabenstellung bei 
Zufallsprozessen in einer Reihe von Arbeiten, z. B. von GELFAND, FROLOoW und 
TscHEnzow [1], ausgenutzt und weiterentwickelt. Die arithmetische Modellierung 
von Zufallsprozessen wird kurz im siebenten Kapitel betrachtet. 

Unter einem konstruktiven Wahrscheinlichkeitsraum werden wir nun einen 
solchen Wahrscheinlichkeitsraum (2, X, P) verstehen, für den eine meßbare Ab- 
bildung ® = @(x), ze [0, 1], des Segments [0, 1] in 2 derart existiert, daß für 
jedes Ace Ü 


u{A} = [de mit B={x:g(e)e 4A}. 
B 


gilt (vgl. TscHenzow [2]). 

Alle im folgenden zu betrachtenden Wahrscheinlichkeitsräume werden als kon- 
struktiv vorausgesetzt. Methoden zur Konstruktion der Abbildung & = g(x), d.h. 
Methoden, mit deren Hilfe die Realisierungen von Zufallsgrößen mit verschie- 
denen Verteilungsgesetzen durch die Realisierung von x ausgedrückt werden, 
werden ausführlich im zweiten Kapitel untersucht. In vielen konkreten Fällen 
sind sie in numerischer Hinsicht aber recht kompliziert. 

Nachdem eine Reihe von Realisierungen der uns interessierenden Zufallsgröße & 
vorliegt, besteht die Aufgabe der Monte-Carlo-Methode nun darin, Kenntnisse 
über ihre Verteilung zu erhalten. Das ist eine typische Aufgabe der mathe- 
matischen Statistik, die Methoden zur Parameterschätzung der Verteilung einer 
Zufallsgröße auf Grund ihrer Realisierungen untersucht. Den Terminus Para- 
meter einer Verteilung werden wir genügend weit verstehen, so daß insbesondere 
Funktionale der Art f g(E) P(dw) = ® mit beliebiger P-meßbarer Funktion g(£) 

2 


eingeschlossen sind. Für die Schätzung eines Parameters # durch Stichproben- 
werte (Realisierungen) &, ...,£n der Zufallsgröße & wird eine gewisse Funktion 
DE, ..,&x) (Statistik) konstruiert, die man Parameterschätzung nennt. Dabei 
werden die &,..., £y als Zufallsgrößen betrachtet, genauer als Zufallsvektor, der 
auf einem Wahrscheinlichkeitsraum definiert ist, dessen Konstruktion von der 
Art der Realisierung der Größen &,, ..., &x abhängt. 

Wenn (2, %X,P) der Wahrscheinlichkeitsraum ist, auf dem & definiert ist, und 
&,..,&y unabhängige Realisierungen (wiederholte Stichproben) von & sind, ist 
der Stichprobenraum (2Y, MA, P®), auf dem Z= (&,..., Ex) definiert ist, das 
Produkt von N Exemplaren des ursprünglichen Wahrscheinlichkeitsraumes, also 


Fax --xR (N Faktoren), 
UN ist die o-Algebra von Mengen der Art 


AN=A,xXAXxX:-xX An A,EN, 
und 
Pz(Ay An) = Pa(A,)  PaylAr) 


Nun sei # irgendein Parameter aus dem Parameterraum ©. Man nennt eine 
Schätzung H&, ..., Ex), die eine meßbare Funktion auf (2°, U, PX) darstellt, 
erwarlungstreue oder unverzerrte Schätzung von Ö, wenn der Erwartungswert von 


® existiert und MÖ(E,, „,&y) =D gilt. Man sagt, daß d asympiotisch erwartungs- 
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treu ist, wenn MÖ(E,, os &x)—>% für N— oo gilt. Konvergiert Men &,) der 
Wahrscheinlichkeit nach gegen # für N — ©, so heißt die Schätzung # (schwach) 
konsistent. Ist 9 eine erwartungstreue Schätzung mit endlicher Dispersion und 
existiert dabei keine andere erwartungstreue Schätzung mit kleinerer Dispersion, 
so nennt man ® eine effektive Schätzung von ®. In dem Fall gibt die Dispersion 
der Schätzung den Grad ihrer Güte an. Im allgemeinen Fall können andere 
Kriterien eingeführt werden. Ausführlicher werden wir uns mit dieser Frage im 
Zusammenhang mit konkreten Aufgaben beschäftigen. 


Es sei jetzt 9 ein Zahlenparameter, und CIE Ex) Mi... En) Seien zwei 
reellwertige Funktionen der Stichprobenwerte mit.9<{ d. Wenn für irgendein 
0<y=<1 die Funktionen 9 und # so ausgewählt werden können, daß P(#< 9 
<d)=y gilt, nennt man (d, d) ein Vertrauensintervall (Konfidenzintervall) für 
”, das dem Konfidenzniveau y entspricht (oder 100y-prozentiges Vertrauens- 
intervall). 

Wir nehmen nun an, daß die Dichte der gemeinsamen Verteilung der Stichprobe 
Es. Ex existiert, und schreiben dafür Pz(&,, ..., 2x; 9). Es ist üblich, diese Dichte 
Likelihood-Funktion der Stichprobe in bezug auf # zu nennen. Existiert eine 
solche Funktion 9 = dx, ..., 2y), so daß Pz(&,, ..., 2x: ®) seinen maximalen Wert 
für d=% annimmt, so spricht man von der Maximum-Likelihood-Schätzung 
(Schätzung größter Glaubwürdigkeit). Die Maximum-Likelihood-Schätzung ist 
eine der grundlegenden Schätzmethoden, die in der Statistik benutzt werden. 
Unter bestimmten Bedingungen ist diese Schätzung asymptotisch erwartungstreu, 
asymptotisch normalverteilt und asymptotisch effektiv. Die Maximum-Likelihood- 
Schätzung kann auch definiert werden, wenn die Existenz der Dichte p> nicht 
vorausgesetzt wird. Eine ausführliche Theorie zu diesen Fragen kann der Leser 
z. B. in dem Buch von Wiırks [1] finden. 


Da das arithmetische Mittel unabhängiger Zufallsgrößen die übliche Schätzung 
des Erwartungswertes in der Monte-Carlo-Methode ist, scheint es passend, einige 
diese Schätzung betreffende Fakten anzuführen, obwohl sie hinreichend gut be- 
kannt sind. 

Es sei & normalverteilt mit dem Erwartungswert «a und der Dispersion 0°; 
Es... &y sind unabhängige Stichprobenwerte von &. Die Likelihood-Funktion in 
bezug auf den Parameter «a ist in diesem Fall 


fi: Hd (x: — a)? 

Pit „m a) = enymor exp I 
— 2 Il 5 2 1.3.1 
= aa nr *P a 2 ma) « ( = ) 


Ihr Maximum erreicht sie unter der Bedingung 


N 
Q= N (&; — a)” —min. 
i=1 
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Es ist ht zu sehen, daß Q dasMinimum genau dann erreicht, wenn a=&(g,, ....,2x) 
N 
=N- = &, ist. Daher ist das arithmetische Mittel (Stichprobenmittel) £ =N- > & 


die Mazintum Likelihond-Sahäkeung füra=M£. Man prüft leicht nach, daß € 
normalverteilt ist mit dem Erwartungswert « und der Dispersion o?/N. Unter 
Benutzung von Tabellenwerten für die Normalverteilung kann man ein Vertrauens- 
intervall für «a zum Konfidenzniveauy angeben. So ist beispielsweise P(j@ — a] 
> 30/YN) = 0,003. 

Das arithmetische Mittel besitzt einige optimale Eigenschaften auch unter all- 
gemeineren Voraussetzungen. Wir betrachten alle möglichen linearen erwartungs- 
treuen Schätzungen des Erwartungswertes der Zufallsgröße & mit endlicher Dis- 
persion o? und im übrigen beliebiger Verteilung, also Schätzungen der Art 


N 
f= Pokl.IE a>d. (1.3.2) 


Man zeigt leicht, daß in der Klasse der erwartungstreuen Schätzungen der 
Gestalt (1.3.2) das arithmetische Mittel die kleinste Dispersion hat. In der Tat 
gilt für eine erwartungstreue Schätzung notwendigerweise die Gleichung 


2Zu4=l1l, (1.3.3) 


N 
und die Dispersion von f£ ist gleich Df = 0? Sc}. Unter der Bedingung (1.3.3) 
i=1 
hat D£f ein eindeutiges Minimum, das für c, =" = cy = 1/X erreicht wird. Die 
angeführten Fakten geben die Begründung für die Schätzung des Erwartungs- 
wertes einer Zufallsgröße &£ durch das arithmetische Mittel& ihrer Stichproben- 
werte. Als erwartungstreue Schätzung der Dispersion wird in der Statistik ge- 
wöhnlich 


ey 2-5 (1.3.4) 


benutzt. Hier gilt nach Wırks [1] folgendes: Sind &,, ..., & unabhängige Stich- 
probenwerte einer Zufallsgröße £, die den Erwartungswert «a, die Dispersion 0? und 
auch endliche dritte or vierte Momente hat, so hat unter den Schätzungen für 


DE von der Gestalt. e: „eute: _ 5) (& — &) die Schätzung 


n 


2 — Er en 8 w 
engl 5) (1.3.5) 


die kleinste Dispersion. Eine Bereichsschätzung der Stichprobendispersion für 
eine normalverteilte Zufallsgröße & ist mit der y?-Verteilung verbunden. Man 
sagt, daß eine Zufallsgröße y°-verteilt mit %k Freiheitsgraden ist, wenn sie die 
Wahrscheinlichkeitsdichte 


1 
plz) = 


ie) 


ka—1 
(3) ee, z>0, (1.3.6) 


$3. Statistik und Monte-Carlo-Methode 31 


besitzt (J(y) ist die Gammafunktion). Die Summe der Quadrate von N unab- 
hängigen normalverteilten Zufallsgrößen mit dem Erwartungswert Null und der 
Dispersion Eins hat eine y?-Verteilung mit N — 1 Freiheitsgraden. Daher gilt 


Zar 


y= P(a< 


Die Werte des ea auf der rechten Seite von (1.3.7) sind tabelliert. Die 
Gleichung (1.3.7) ist äquivalent der Gleichung 


7. 2 N _ 22 
e(= BE 2&=y, 


< E f pen) de. (1.3.7) 


b = E [7 


woraus folgt, daß [(N — 1) s?/b, (N — 1) s?/a] ein Vertrauensintervall für 0? zum 
Konfidenzniveau y ist. 

In den folgenden Kapiteln werden wir eine Reihe anderer statistischer Schätzun- 
gen betrachten, die in Verbindung mit Monte-Carlo-Methoden benutzt werden. 


2. Empirische Verteilungsfunktionen und Kriterien für die Übereinstimmung von 
Verteilungen. Es sei £ eine Zufallsgröße mit der Verteilungsfunktion Fy(x), und 
Es, &n seien unabhängige Realisierungen von &. Wir bezeichnen mit vy(x) die 
Anzahl der Werte £&,, für die &,< x ist. Die Funktion Ff(&) = vy(&)/N heißt 
empirische Verteilungsfunktion der Zufallsgröße & Es ist bekannt (vgl. GnE- 
DENKO [1]), daß die empirische Verteilungsfunktion für N — oo der Wahrschein- 
lichkeit nach in jedem Punkt x gegen F';(«) strebt. Uns interessiert die Verteilung 
des Fehlers, der beim Ersetzen von F;(x) durch die empirische Verteilungsfunktion 
entsteht. In der mathematischen Statistik gibt es eine Reihe von Kriterien, die 
eine Beurteilung der Annäherung von FY(«) an Fx(x) erlauben. 


1. Kriterium von A. N. KoLmocororr. Für alle y > 0 gilt 


lim 1P (sup Fax) — F%a)| < m )-,2 $ (- 1). exp (— 22). (1.3.8) 
No Y+ Y k= © 

2. w®-Kriterium. Für alle y > 0 gilt 
lim P ( f Fa) — Fa)P dF(a) < y) = 6(y), (1.3.9) 
N->00 Pi 


wobei @(x) eine Verteilungsfunktion mit der charakteristischen Funktion 


ist (bekanntlich bestimmt die charakteristische Funktion eindeutig die Vertei- 
lungsfunktion). 


3. Kriterium von H. W.Smirxow. Für alley > 0 gilt. 


lim P (sup (Fe) — Fıa)) < 2) = 1 exp (—2/%). (1.3.10) 


N->oo YN 
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Die Funktionen auf den rechten Seiten der Gleichungen (1.3.8), (1.3.9) und 
(1.3.10) sind tabelliert. 


4. x°-Kriterium von K. Psarson. Nach diesem Kriterium besitzt die Größe 


ı 2 

E=Ny Isar“ = rare) Izarın I (1.3.11) 
j=1 I A; 4 

wobei 4}. Ag; ..., A: disjunkte Intervalle auf der reellen Achse sind, für N — 

eine x?-Verteilung mit Z — 1 Freiheitsgraden, falls die Integrale von dF und dF* 

über jedes der Intervalle A, nicht zu klein sind. Praktisch wird dieses Kriterium 

für den Fall benutzt, daß N S dF(x) > 10 ist. Werden gewisse Annahmen (soge- 


nannte Hypothesen 4,) über ‘die Gestalt der Funktion F gemacht, ergeben sich 
bei N gegebenen Stiehprübketwerten die Prüfgrößen 


YN sup |F(x) — F*(«)| für das Kolmogoroff-Kriterium, 
7 


NS [IF(&e) — F*(x)P dF(&) für das ©°-Kriterium usw. 

Weil die Verteilung dieser Prüfgrößen bei geeigneter Wahl von F bekannt ist, 
kann der Apparat der statistischen Hypothesenprüfung benutzt werden, d. h., die 
Hypothese über die Nähe zwischen F und F* wird angenommen, wenn die ent- 
sprechende Prüfgröße einen festgesetzten Wert nicht übersteigt, oder abgelehnt 
im entgegengesetzten Fall. 

Die praktische Seite der Anwendung der beschriebenen Kriterien auf Aufgaben, 
wie sie bei der Benutzung der Monte-Carlo-Methode entstehen, wird recht aus- 
führlich in der Monographie von GOLENKo [1] betrachtet. 


3. Die Monte-Carlo-Methode. Eine grundlegende numerische Aufgabe, die ge- 
wöhnlich mit der Monte-Carlo-Methode gelöst wird, ist die Schätzung des Erwar- 
tungswertes irgendeiner Zufallsgröße, d. h. die Berechnung eines Lebesgueschen 
Integrals über einem Wahrscheinlichkeitsmaß. Dieses Maß kann recht kompli- 
zierter Natur sein und kann als Komposition einfacherer Verteilungen angegeben 
sein. Am häufigsten wurde dabei der Fall studiert, daß ein endliches zweites 
Moment der Zufallsgröße existiert (Aufgabe A, wie wir auch sagen werden). Das 
einfachste Rechenschema für diese Aufgabe besteht in folgendem: Man berech- 
net N unabhängige Realisierungen der Zufallsgröße und schätzt ihren Erwar- 
tungswert durch das arithmetische Mittel dieser Realisierungen ab. Als Grundlage 
dafür dient die Tatsache, daß unter den linearen erwartungstreuen Schätzungen 
das arithmetische Mittel die kleinste Dispersion hat. Eine Abschätzung des 
Fehlers mit Wahrscheinlichkeitscharakter kann man aus der Tschebyscheffschen 
Ungleichung (1.2 2.6) erhalten. 

Wenn wir ein genügend kleines y vorgeben und y = o?/Ne? setzen (also e = il 


Y Ny), ergibt u 
> BE-Mi<z mzı-r. (1.3.12) 
d. h., mit einer W Be von 1— y unterscheidet sich das arithmetische 


Mittel unabhängiger Realisierungen von & um nicht mehr von M£ als o/YNy. 
Bei festem y und o nimmt der Fehler also wie N -!!? ab. 
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Sind die Bedingungen < ai Anwendbarkeit des zentralen Grenzwertsatzes 


erfüllt, so kann die Größe +; zE ı für genügend großes N als normalverteilt mit 


dem Erwartungswert M& u der Dispersion o°/N angesehen werden. Das gibt 
uns die Möglichkeit, ein Konfidenzintervall für den Fehler zu konstruieren, wie 
das im ersten Abschnitt dieses Paragraphen angegeben wurde. Dafür ist aber 


1 
notwendig, daß sich die Verteilung der Größe - — v£ €, höchstens um eine Größe 


der Ordnung N U? von der Normalverteilung ER Die Größe der Dis- 
persion, die den Fehler bestimmt, kann auch während der Rechnung geschätzt 
werden. Auf diese Weise erhält man die Möglichkeit, während der Rechnung die 
Zahl N zu bestimmen, die die notwendige Genauigkeit mit der vorgegebenen 
Wahrscheinlichkeit (Sicherheit) garantiert. Diese Eigenschaft der Monte-Carlo- 
Methode ist also für die praktische Anwendung der Methode sehr wichtig. Die 
Aufgabe A ist daher eng mit der Aufgabe der Parameterschätzung einer Normal- 
verteilung verknüpft. Hier liefert die Schätzung des Erwartungswertes die Lö- 
sung der Aufgabe, während die Schätzung der Dispersion eine Abschätzung des 
Fehlers gewährleistet. Da die Ordnung O(N 42), mit der der Fehler abnimmt, 
für genauere Berechnungen zu groß ist, gibt es verschiedene Verfahren der 
Transformation von Zufallsgrößen, die den Erwartungswert fest lassen, aber die 
Dispersion ändern. Uns interessieren natürlich Verfahren zur Verkleinerung der 
Dispersion. Die Darstellung solcher Verfahren macht einen bedeutenden Teil 
dieses Buches aus. 

Die Möglichkeit der genannten Transformation von Zufallsgrößen resultiert aus 
der Darstellung (1.2.1), also aus der ad 


ME = = [Wei (do) = - [#03 2, o) ndo) 


mit P<u. Diese Darstellung a es, anstelle des Erwartungswertes von 


£ nach dem Maß P den Erwartungswert von & zn nach dem Maß a zu berechnen. 


Benutzt man DE = f &*(o) P(do) — (M&)?, so gilt 
De) en I} (ei) uldo) — (Mir.  ° (1.3.13) 
dyı 
Daher ist im allgemeinen DE +D (i 2). Vom numerischen Standpunkt genügt 


es nicht, vu so zu wählen, daß D (& 1, ) Meiner als D£ wird, weil die Modellierung 
der Zufallsgröße & = bedeutend komplizierter sein kann als die Modellierung 


der ursprünglichen Größe &. Darım muß man eine Transformation benutzen, die 
den zum Erreichen der geforderten Genauigkeit (bei gegebener Sicherheit) not- 
wendigen Rechenaufwand verkleinert. 
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Wir werden im weiteren Transformationen, die den Erwartungswert der Zufalls- 
größe fest lassen, aber ihre Dispersion ändern, Modifikationen in der Monte-Carlo- 
Methode nennen. Die Klasse von Modifikationen, die wir betrachten werden, 
wird nicht durch Transformationen der Gestalt (1.3.13) erschöpft. Der Arbeit 
von FroLow und TscHenzow [1] folgend, führen wir den Begriff der effektiven 
Modifikation (im Rahmen des Schemas A) ein. Es sei r die Zeit, die für die Be- 
rechnung einer Realisierung der Zufallsgröße 7 auf einer EDVA notwendig ist. 
Als Effektivität einer Modifikation werden wir die Größe (TD)-" einführen, d. h., 
der Modifikation mit kleinerem rDn wird eine größere Effektivität zugeschrieben. 
Dabei sind aber noch einige Einschränkungen zu machen. Erstens kann dieses 
Effektivitätskriterium natürlich nur im Rahmen des Schemas A angewendet wer- 
den. Bei der Betrachtung anderer Aufgabentypen wird darüber noch ausführlicher 
gesprochen. Zweitens muß gleiche Qualität der Programme vorausgesetzt werden, 
mit denen die Rechnung der verschiedenen Modifikationen ausgeführt wird. Somit 
hängt die Zeit wesentlich davon ab, ob das Programm oder der benutzte Compiler 
für die EDVA gewissen Qualitätsforderungen entspricht. Schließlich wird man 
manchmal eine weniger effektive Modifikation deswegen bevorzugen, weil es schon 
ausgearbeitete Algorithmen und Programme gibt. 

Jetzt soll der Erwartungswert einer Zufallsgröße unter der Bedingung berechnet 
werden, daß ihr zweites Moment unendlich ist (Aufgabentyp B). Aus der Beziehung 
(1.3.13) folgt bereits die Möglichkeit, die Aufgabe B auf die Aufgabe A zurück- 
zuführen, d.h. eine Zufallsgröße mit demselben Erwartungswert, aber endlicher 
Dispersion zu konstruieren. Manchmal ist es aber schwer, eine solche Transfor- 
mation zu finden, oder es ist praktisch unmöglich, sie wegen ihrer Kompliziertheit 
zu realisieren. Es kann auch sein, daß der Umfang der Rechenarbeit bei vor- 
gegebenem Fehler trotz der erreichten Endlichkeit der Dispersion wächst. (Das 
oben definierte Effektivitätskriterium einer Modifikation ist in diesem Fall nicht 
anwendbar). Die Frage der Konstruktion einer Schätzung für den Erwartungswert 
im Fall der Aufgabe B ist noch ungenügend untersucht. Die Benutzung des 
arithmetischen Mittels als Schätzwert in der bekannten Weise ist gerechtfertigt, 
weil die Konvergenz des Schätzungswertes gegen den Erwartungswert der Wahr- 
scheinlichkeit nach gesichert ist (die Schätzung ist erwartungstreu und konsistent). 
Die Frage der Konvergenzordnung bei der Berechnung endlichdimensionaler Inte- 
grale wurde von N. S. BachwAaLow [3] untersucht. Ein späteres, aber auch all- 
gemeineres Resultat wurde in Kap.I, $2, in Gestalt der Ungleichung (1.2.8) 
formuliert. Aus dieser Ungleichung folgt 


N 
MS&-MS-ME-MIr, 1<r<2, (1.3.14) 
(: 


ef = Nt-1 


d.h., der Erwartungswert des Fehlerbetrages der Schätzung nimmt wie N!" ab. 
Die genaue Verteilung des Fehlers kann auch erhalten werden, aber ihre Form ist 
recht kompliziert, und in der Literatur gibt es keine fertigen Algorithmen, aus 
der man in bequemer Form ein Vertrauensintervall für den Fehler der Schätzung 
konstruieren könnte. 

Falls das r-te Moment (1<“r<“ 2) existiert, können offensichtlich bessere 
Schätzungen für den Erwartungswert als das arithmetische Mittel konstruiert 
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werden. So stellt die Benutzung des Gesetzes der großen Zahlen nur eine der Mög- 
lichkeiten bei der Anwendung der Monte-Carlo-Methode dar. Eine andere Mög- 
lichkeit bieten die verschiedenen Schätzmethoden der mathematischen Statistik. 
Es gibt einige Beispiele für die Lösung der Aufgabe B. Wir werden diese Bei- 
spiele in den folgenden Kapiteln untersuchen. 

Das Effektivitätskriterium für Modifikationen, das in allgemeiner Form oben 
formuliert wurde, kann offensichtlich auf den Fall der Aufgabe B erweitert werden, 
aber die genaue Formulierung eines solchen Kriteriums ist wegen der noch unge- 
nügenden Untersuchungen ein offenes Problem. 


Wir werden im folgenden auch die Aufgabe betrachten, den Erwartungswert ab- 
hängiger Zufallsgrößen zu schätzen (Aufgabe C). Einige Fakten, die sich auf diese 
Aufgabe beziehen, wurden im $ 2 dieses Kapitels angegeben. In der Mehrzahl der 
Fälle besteht das allgemeine Lösungsschema wie auch im Fall A in der Parameter- 
schätzung einer Normalverteilung. Eine gewisse Schwierigkeit in numerischer Hin- 
sicht bietet hier die Schätzung der Dispersion. Ausführlicher werden wir uns mit 
dieser Frage im nächsten Kapitel beschäftigen. Man kann auch noch eine AufgabeD 
aufzeigen. Hier ist der Erwartungswert abhängiger Zufallsgrößen zu schätzen, 
wenn die Grenzverteilung des arithmetischen Mittels durch ein von der Normal- 
verteilung abweichendes, stabiles Gesetz dargestellt wird. Dem Autor sind aber 
keine Beispiele der praktischen Lösung dieser Aufgabe bekannt. 

Die aufgezählten Aufgaben erschöpfen natürlich nicht alle Aufgabentypen, die 
mit Hilfe der Monte-Carlo-Methode gelöst werden können, obwohl im gewissen 
Sinne andere Aufgaben auf sie zurückführbar sind. So kann z. B. die Schätzung 
des Erwartungswertes einer zufälligen Funktion &(9,o) auf die Schätzung ihres Er- 
wartungswertes für einige feste Parameterwerte 9 und anschließende näherungs- 
weise Konstruktion der Funktion M&(d,o) durch Interpolation zurückgeführt wer- 
den. Hier sind auch andere Lösungswege möglich, die von uns später betrachtet 
werden. - " 

Aus dem Dargelegten folgt, daß die Monte-Carlo-Methode eng mit Aufgaben der 
Wahrscheinlichkeitstheorie, der mathematischen Statistik und der numerischen 
Mathematik verknüpft ist. Im Zusammenhang mit der Modellierung von Zufalls- 
größen (insbesondere gleichverteilten) spielt auch die Zahlentheorie eine wesent- 
liche Rolle. Die mit der Zahlentheorie zusammenhängenden Fragen werden haupt- 
sächlich im letzten Kapitel dieses Buches behandelt. 

Gegenüber anderen numerischen Verfahren zeichnet sich die Monte-Carlo- 
Methode durch ihre Einfachheit und Allgemeinheit aus. Die langsame Konvergenz 
ist ein wesentlicher Nachteil dieser Methode, aber unter bestimmten Voraussetzun- 
gen kann, wie wir weiter sehen werden, durch ihre Modifikationen eine bessere Kon- 
vergenzordnung erreicht werden. Dabei wird allerdings die numerische Prozedur 
komplizierter und nähert sich in ihrer Kompliziertheit anderen Prozeduren der 
numerischen Mathematik an. Die Konvergenz der Monte-Carlo-Methode ist eine 
Konvergenz der Wahrscheinlichkeit nach. Dieser Umstand sollte aber kaum zu 
ihren Nachteilen gerechnet werden, da stochastische Methoden in genügendem 
Maß durch praktische Anwendungen gerechtfertigt werden. Was schließlich Auf- 
gaben mit stochastischem Inhalt betrifft, so erscheint bei ihrer Untersuchung sogar 
die Konvergenz der Wahrscheinlichkeit nach im gewissen Sinn natürlich. 


3» 


II. MODELLIERUNG VON VERTEILUNGEN 


$ 1. Unabhängige gleichverteilte Zufallsgrößen 


Wie schon bemerkt, liegt der Anwendung der Monte-Carlo-Methode eine auf dem 
Intervall [0, 1] gleichverteilte eindimensionale Zufallsgröße x zugrunde, d.h. eine 
Zufallsgröße mit der Verteilungsdichte 
1 für ze[0,1], 
(@) = : 
0 für z8[0,1]. 
Wir geben einige einfache Eigenschaften von «& an. 
1. Ist x mit der Dichte (2.1.1) verteilt, so ist x’ = (b — a)«x + a gleichverteilt 
auf dem Intervall [a, b], b > a, d. h., &’ besitzt die Dichte 
Be 
b—a 


2.1.1) 


für xze[a,b], 


0 für ze[a,b]. 


2. Die diskreten Zufallsgrößen 8; = 1, ..., N) seien in ihrer Gesamtheit unab- 
hängig, die $; @=1,..., N — 1) nehmen nur die Werte 0 und 1 mit den Wahr- 
scheinlichkeiten P(f, = 0) = P($; =1) = 1/2an, und ß, seiauf [0, 1] gleichverteilt. 
Dann ist 


Bu A Pu (2.1.2) 


38 — 


i=1 


eine auf [0, 1] gleichverteilte Zufallsgröße. 
Wir betrachten den Fall N = 2. Dann ergibt sich 


(+9 <= rar (Sse)+ ra nr (g+<e) 


Ar (bas)uirlace-}) 


vo| 


Nun ist aber 
x <0, 


P(d, = 2«) je m für ze (0,1/2], 
z>1/2, 
für zs1j2, 
|: 2:—1 für xe(1j2,1], 
für: Sl“ 


Pi, <2%2—1) 
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Daraus folgt unmittelbar die gesuchte Beziehung 
B 0 für =<0, 
(4+2<2)- z für 0<z<sIl, 
l’ für &>tT. 


Der Beweis im allgemeinen Fall wird mit vollständiger Induktion geführt. 

3. Es sei F,(x) die Verteilungsfunktion zu der Dichte p,(x) ; die ß; (1, ..., N—1) 
seien in ihrer Gesamtheit unabhängige diskrete Zufallsgrößen, die die Werte 0 
und 1 mit den Wahrscheinlichkeiten P(ß; = 0) =P(ß; = 1) = 1/2 annehmen. 
Dann gilt 

u 
P fi — 
(z gi E F,(®) < = 35-1 
In. der Tat, ist $x auf [0, 1] gleichverteilt und sind die $; @=1,..., N) in ihrer 
Gesamtheit unabhängig, so gilt bei beliebigen festen Werten von fx 


(ee 


N- 
1 Dam 


wobei «’ auf [0, 1] gleichverteilt ist. Dann gilt aber 


= 980-1 


Pl sr) Sr + zn 


woraus das Gewünschte folgt. 


N-ı1 fi 
Daher ist Jan P E auf [0, 1] gleichverteilt. Man kann auch sagen, daß a 


die Darskällung 0 ‚B, B.. . als Dualzahl gestattet, wobei die $; unabhängige diskrete 
Zufallsgrößen sind, die die Werte 0 und 1 mit gleicher Wahrscheinlichkeit an- 
nehmen. Analog gestattet x die Darstellung in der Form eines Bruches 0,y,y3 : - » 
des r-Positionssystems, wobei die y; unabhängig sind und die Werte 0, 1,..,r — 1 
mit der Wahrscheinlichkeit 1/r annehmen. 

An eines der Verfahren, eine Folge unabhängiger Realisierungen &,,&g, . . . der 
Zufallsgröße x mit Hilfe des Roulettespiels oder des Münzenwerfens zu gewinnen, 
erinnerten wir schon im ersten Kapitel. Es findet seine Begründung in den auf- 
geführten Eigenschaften von x. Man kann von solehen Verfahren ausgehen, um 
Realisierungen von x zu erhalten. Dabei entstehen aber eine Reihe von Fragen: 


1. Wie ist eine ideale Durchführung der genannten Experimente zu garantieren, 
wenn der Einfluß unvermeidlicher Fehler bei der gewählten „Experimentier- 
vorrichtung‘“ ausgeschlossen werden soll? 

2. Wenn man von der Gleichverteilung auf [0, 1] spricht, dann hat man eine 
Realisierung von & mit einer unendlichen Anzahl gültiger Ziffern im Auge. 
Das setzt eine beliebig große Genauigkeit bei der Berechnung mit dem Roulette- 
spiel oder eine beliebig große Anzahl von Münzenwürfen voraus, um eine 
Realisierung von « zu erhalten. Worin bestehen nun die Folgen der unvermeid- 
lichen endlichen Stellenzahl ? 
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3. Schließlich ist die Frage keineswegs trivial, wie ein analoges ideales Experi- 
ment auf einer Rechenanlage zu organiseren ist. 


Die Erörterung dieser Fragen soll auch in den vorliegenden Paragraphen mit 
erfolgen. Vor allem werden wir uns mit der Endlichstelligkeit jeder Realisierung 
von x beschäftigen. Diese Frage entsteht bei der Anwendung jeder numerischen 
Methode und ist sogar weder mit der Undurchführbarkeit eines Experiments mit 
hinreichend langer Dauer oder beliebiger Genauigkeit noch mit den Möglichkeiten 
entsprechender Rechenanlagen verbunden. Dabei kann man von zwei Stand- 
punkten ausgehen. Der erste besteht darin, daß wir von vornherein auf die Be- 
trachtung einer Zufallsgröße verzichten, die auf dem Intervall [0, 1] gleichverteilt 
ist und stattdessen eine Zufallsgröße & betrachten, die gleichverteilt in bezug auf 
ein geeignetes diskretes Maß ist. Wenn die Anlage eine feste Wortlänge von 
n. Dualziffern für Zahlen aus [0, 1] hat, so kann man errechnen, daß & mit der 
Wahrscheinlichkeit 2” die Werte k- 2°" (k= 0,1, ..., 2*— 1) annimmt, und 
nun die Aufgabe betrachten, Realisierungen dieser Zufallsgröße zu erhalten. 

Der andere Standpunkt besteht darin, daß wir gegebenenfalls mit beliebig vielen 
Ziffern rechnen könnten, daß man sich aber auf » Stellen beschränkt, weil die 
weiteren Ziffern das Ergebnis nicht beeinflussen. Es ist rationell, diesen zweiten 
Standpunkt etwas hervorzuheben, denn der erste Standpunkt bedeutet eine Be- 
schränkung analog der Forderung, bei der Berechnung von 2 nur n Ziffern zu 
benutzen, während das Ergebnis der Rechnungen wesentlich von den folgenden 
Ziffern abhängen kann. Weiterhin werden wir daher annehmen, daß & mit jeder 
notwendigen Anzahl von Ziffern erhalten werden kann. Dabei ist es offensichtlich, 
daß mit einer genügenden Anzahl von Realisierungen von & auch eine Realisierung 


m 
von mit der notwendigen Genauigkeit zu erhalten ist. Es genügt, = N 2"i &, 


i=0 

zu setzen (bei entsprechender Wahl von m und eventueller Rundung). Die Frage 
nach der notwendigen Anzahl von Ziffern hängt von der konkreten Aufgabe ab 
und muß mit Mitteln der numerischen Mathematik untersucht werden. So wird 
unsere Aufgabe zurückgeführt auf die Aufgabe, Realisierungen von diskreten, 
gleichverteilten Zufallsgrößen zu bekommen. Wenn solche Realisierungen in der 
notwendigen Menge erhalten werden, so kann man sie in der Rechenanlage spei- 
chern und aus ihnen dann Realisierungen mit der notwendigen Anzahl von Ziffern 
zusammensetzen. Anders gesagt, man kann Tabellen von Zufallszahlen benutzen. 

Tabellen von Zufallszahlen wurden schon lange vor der Entstehung der Monte- 
Carlo-Methode in ihrer gegenwärtigen Form aufgestellt. Solche Tabellen wurden 
mit der Entwicklung von Verfahren der Zufallsauswahl bei der Planung von 
Experimenten in Biologie, Medizin, Landwirtschaft und anderen Gebieten not- 
wendig. Es gibt verschiedene Ausgaben solcher Tabellen, die gewöhnlich in 
Gruppen angeordnete Zahlen des Zehnersystems enthalten. Die erste Tabelle 
dieser Art wurde von Tırrer [1] aufgestellt, gebraucht wurden sie bei Volks- 
zählungen. Ebensolche Tabellen wurden in der Sowjetunion von KAapyrow [1] 
angefertigt. Bei ihrer Aufstellung ist es sehr schwer, den Einfluß soleher Faktoren 
auszuschließen, die die Gleichverteilung und damit die Zufälligkeit stören. KEN- 
DALL und BABısGToN-SMITE [1] benutzten für die Anfertigung ihrer Zufallszahlen- 
tabellen ein Roulette, dargestellt durch einen in zehn gleiche Sektoren geteilten 
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Kreis (entsprechend den zehn Ziffern 0,1, ...,9). Sie trafen verschiedene Vor- 
sichtsmaßnahmen, um eine einwandfreie Durchführung des Experiments zu ge- 
währleisten. Aber, wie die Autoren mitteilen, hegte ein bei der Arbeit helfender 
Assistent eine Antipathie gegenüber ungeraden Ziffern (insbesondere gegen die 
Ziffern 1, 3 und 9) und eine Sympathie für die Ziffern 0 und 6. Darum mußten 
die durch ihn registrierten Resultate ausgeschlossen werden. Durch die RAND- 
Corporation wurden 1947 Zufallszahlentabellen aufgestellt, die 1000000 Dezimal- 
ziffern enthalten. Dabei wurde eine spezielle schnelle Vorrichtung eines ‚„elek- 
tronischen Roulettes‘‘ benutzt, ein Zufallszahlengenerator, der auf einem physi- 
kalischen Prinzip beruht (Generator zufälliger Impulse). Die erhaltenen Daten 
wurden einer sorgfältigen Analyse durch statistische Teste unterworfen. Ein 
gewisser Teil der Daten bestand die Prüfung nicht und erforderte eine bestimmte 
Korrektur des erhaltenen Materials. Wir werden hier nicht konkrete Resultate 
aus der Überprüfung der genannten Tabellen anführen. Diese Resultate kann 
man in der schon zitierten Literatur finden. Es ist wichtig zu bemerken, daß 
die Güte des Experiments letzten Endes auf der Grundlage statistischer Teste 
beurteilt werden muß. 

Gewöhnlich benutzt man ein recht kompliziertes System von Testen, die sowohl 
auf die ganze Folge wie auch auf einzelne ihrer Teile angewendet werden. 

Es sei ß,; ..., Bn eine Folge von Realisierungen der Zufallsgröße ß, die die Werte 0 
und l annimmt. Zerlegt man diese Folge in unabhängige Gruppen der Länge n 
und setzt voraus, daß $ annähernd gleichverteilt ist, dann kann man annehmen, 
daß die erhaltenen Gruppen annähernd die Dualzahlendarstellung einer gleichver- 
teilten Zufallsgröße angeben. Die Prüfung auf Gleichverteilung und Unabhängig- 
keit der erhaltenen Zahlen wird mit Hilfe von Testen durchgeführt. 

Insbesondere erlauben es die Kriterien der Übereinstimmung von Verteilungen 
(Kap. I, $ 3), die Abweichung einer empirischen Verteilungsfunktion der gegebenen 
Folge von einer theoretischen zu beurteilen. Diese Kriterien werden auch sehr - 
oft in der Praxis benutzt. Wir werden nicht näher auf konkrete Teste und die 
Technik ihrer Anwendung in bezug auf die Gleichverteilung von Folgen eingehen. 
Diese Dinge sind z. B. in der Monographie von GoLENKo [1] enthalten. Wir be- 
merken nur, daß die Wahl des Konfidenzniveaus bei dem genannten Verfahren 
schwer theoretisch zu begründen ist; und man muß solche Aussagen wie „‚gewöhn- 
lich ist es üblich anzunehmen“ und dergleichen verwenden. 

Die Behauptung ‚eine gegebene Folge ß,, ..., dx, die aus Nullen und Einsen be- 
steht, stellt mit der Wahrscheinlichkeit 1 eine Folge unabhängiger Realisierungen 
der Zufallsgröße ß, P(# = 0) = P(ß = 1) = 1/2 dar‘ kann nur für N — 0 ausge- 
sprochen werden, wenn Paare und andere Kombinationen von Nullen und Einsen 
in der Folge mit der Häufigkeit angetroffen werden, die gegen die entsprechende 
Wahrscheinlichkeit strebt. Das bedeutet, daß bei beliebigem festen n die Beziehung 


or 
lim — 2 1=P(f, = yo. Ban = Yu (2.1.3) 


N->o N ine in 


erfüllt sein muß, wobei ß,, ..., x unabhängige Realisierungen von ß sind, Yıs +++» Yn 
eine gegebene Folge von Nullen und Einsen ist und ö. Werte aus einer Untermenge 
von (1,.... N) annimmt, für die ,, = yı gilt. Diese Beziehung soll für alle r 
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Prüfung solcher Beziehungen praktisch nicht möglich ist. Die statistischen Teste 
garantieren eine annähernde Erfüllung dieser Gleichungen, aber ihr Gebrauch ist 
mit den schon genannten Unzulänglichkeiten verbunden. 

Die erste Aufgabenstellung für den Fall eines endlichen N betrachtete A.N. 
KoLMOoGoRroFF [2], der den Begriff von (n,e)-Tabellen von Zufallszahlen einführte 
und ihre Existenz bewies. Eine Stichprobe vom Umfang » aus der endlichen 
(n,e)-Tabelle vom Umfang N erfüllt mit der Genauigkeit & die Bedingungen, die 
für Tabellen unendlichen Umfangs gelten. Obwohl diese Idee im Zusammenhang 
mit den untersuchten Fragen erstrangige Bedeutung hat, beschränken wir uns nur 
auf den Hinweis bezüglich der Arbeit von KoLMoGoROFF [2], denn eine Begründung 
der Monte-Carlo-Methode auf der Grundlage dieser Ideen ist praktisch noch nicht 
verwirklicht worden. P 

Entsprechend dem von uns eingenommenen Standpunkt werden wir im folgenden 
annehmen, daß man im Fall befriedigender Ergebnisse bei der Prüfung einer Folge 
mit Hilfe statistischer Teste diese Folge in Rechnungen mit der Monte-Carlo- 
Methode anwenden kann. Wir werden während der weiteren Darstellung aber auf 
diese Fragen zurückkommen und präzisieren, welche Teste gemeint sind. 

. Wenn es eine genügend umfangreiche Tabelle von Zufallszahlen gibt, so kann 
damit die Frage nach einer Quelle für unabhängige Realisierungen von «a als prin- 
zipiell gelöst betrachtet werden. Praktisch ist aber die Speicherung einer umfang- 
reichen Tabelle im Speicher einer EDVA äußerst unbequem, so daß Tabellen von 
Zufallszahlen praktisch nicht benutzt werden (mit sehr seltenen Ausnahmen). 

Eine bequemere Methode zur Erzeugung der Realisierungen von x besteht in 
der Schaffung einer speziellen Einrichtung, eines sogenannten Zufallszahlengene- 
rators, auf physikalischer Grundlage. Ein solcher Generator gibt bei jedem 
Arbeitstakt eine zufällige Ziffer in den Speicher ab. Falls derartige Einrichtungen 
praktisch genutzt werden, besteht ein Mangel in der Unmöglichkeit, die Rechnun- 
gen zu wiederholen, und, was noch wichtiger ist, in der Störanfälligkeit der Ein- 
richtung im Arbeitsprozeß. Daher ist eine parallele Prüfung der so erzeugten 
Zufallszahlenfolge durch Teste notwendig. Diese Gründe bedingen auch die seltene 
Anwendung physikalischer Zufallszahlengeneratoren. 

In praktischen Rechnungen ist es am bequemsten, Realisierungen von x mittels 
irgendeines Algorithmus zu erhalten. Zahlen, die so erzeugt werden, heißen Pseudo- 
zufallszahlen. Es ist gewöhnlich recht schwierig zu zeigen, daß der eine oder andere 
Algorithmus eine Folge mit den von uns gewünschten Eigenschaften liefert. Daher 
wird ein strenger Beweis oft durch gewisse intuitive Erwägungen ersetzt oder nur 
einige Eigenschaften des Algorithmus werden theoretisch begründet. Weiter wen- 
det man die schon erwähnten Teste an, auf deren Grundlage der Algorithmus ent- 
weder als brauchbar anerkannt oder verworfen wird. Dazu kommt die zusätzliche 
Forderung, daß für die Erzeugung der Pseudozufallszahlen nur eine kleine Anzahl 
von Arbeitstakten der EDVA benötigt werden sollte. 

Die Mehrzahl der benutzten Pseudozufallszahlenfolgen wird durch eine Rekur- 
sionsformel auf folgende Weise erhalten. Es sei 


%rr = ati: “.., x;) i (2.1.4) 


mit fester Zahl k, wobeii=1,2,... ist; a stellt eine ganzzahlige Funktion ganzzah- 
liger Argumente mit O<a<{ P dar (P natürliche Zahl), und x, %, ..., &x—ı sind 
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natürliche Zahlen, die P nicht übersteigen und am Beginn der Rechnung gegeben 
sein müssen. Eine Pseudozufallszahlenfolge &g; &1; ---,&; € [O, 1], wird dann durch 
die Gleichungen 

%ı 


u=5: FE 5 (2.1.5) 


definiert. In der Mehrheit der konkreten Fälle ist «a in der Form 
k-1 
Citk =| P3 bj&ı45 + ö) (mod P) (2.1.6) 
j=0 


gegeben, wobei die b,; und ® ganze Zahlen sind. Als &;,, nimmt man also den 
Rest bei der Division des Wertes einer ganzzahligen linearen Funktion durch die 
Zahl P. Die Methode, eine Pseudozufallsfolge durch Formel (2.1.6) zu erhalten, 
trägt die Bezeichnung Kongruenzmethode. Sie wurde durch LEHMER [1] vorge- 
schlagen. Es gibt eine umfangreiche Literatur, in der die Eigenschaften der so 
erhaltenen Folgen untersucht werden (siehe Janssox [1]). 

Die einfachste Gestalt bekommt (2.1.6) fürk=1 und 9= (0. In diesem Fall 
spricht man von einer multiplikativen Methode zur Erzeugung von Pseudozufalls- 
folgen. Für # + 0 gebraucht man die Bezeichnung ‚‚gemischte Methode“. 

Es ist leicht zu sehen, daß die durch die Formeln (2.1.4) und (2.1.5) erhaltenen 
Folgen periodisch sind, weil die Funktion « nur eine endliche Anzahl von Werten 
annimmt und die Kombination von Anfangswerten, die die Folge vollständig be- 
stimmt, sich früher oder später wiederholt. 

Die multiplikative Methode wurde auf Grund zahlentheoretischer Erwägungen 
vorgeschlagen. Zu ihrer Begründung werden wir im letzten Kapitel kommen, wo 
auch Ergebnisse angeführt werden, die die Periodenlänge der entsprechenden 
Folgen betreffen. Auf andere Methoden zur Erzeugung von Pseudozufallszahlen 
werden wir nicht eingehen. Angaben darüber findet der Leser beispielsweise in 
den Monographien von GOLENKO [1], Janssox [1] und in der Arbeit von Sogot. [4], 
in denen solche Methoden recht ausführlich beschrieben werden mit Hinweisen auf 
Ergebnisse bei der Anwendung statistischer Teste. 

Im Hinblick auf die genannten Monografien sind wir nur auf die allgemeine 
Problematik eingegangen, die mit der Erzeugung unabhängiger Realisierungen 
einer gleichverteilten Zufallsgröße verbunden ist. 

Faßt man das Gesagte zusammen, so bemerkt man, daß sich natürlicherweise 
zwei Zugänge zur genannten Aufgabe abzeichnen. Einen von ihnen kann man etwa 
den „experimentellen Weg‘ nennen. Er besteht darin, daß irgendein Experiment 
durchgeführt wird, dessen Charakter beliebig ist und von dem anzunehmen ist, 
daß es Werte der geforderten Folge liefert. Danach gestatten statistische Teste, 
die Berechtigung unserer Annahme zu beurteilen. 

Das System der Teste muß} genügend umfangreich sein, wenn wir unsere Folge 
tatsächlich als Folge unabhängiger Realisierungen der Zufallsgröße « betrachten 
wollen. Es ist übrigens zu bemerken, daß manchmal zur Lösung der gegebenen 
Aufgabe oder sogar einer gewissen Klasse von Aufgaben die Prüfung der Folge 
mit einigen speziellen Testen genügt. 

Der zweite mögliche Weg, den wir im Kern nicht berührt haben und der natür- 
licherweise konstruktiv zu nennen ist, besteht in der Angabe eines theoretischen 
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Verfahrens zur Konstruktion einer Folge mit den notwendigen Eigenschaften. 
Diese Aufgabe ist sehr kompliziert, und wir betrachten sie im letzten Kapitel. 

Im weiteren nehmen wir an, daß uns eine Folge von Realisierungen einer auf 
[0, 1] gleichverteilten Zufallsgröße zur Verfügung steht, und bei der Herleitung 
theoretischer Ergebnisse (bis zum siebenten Kapitel) gehen wir von dieser Annahme 
aus. Durch den Buchstaben x mit verschiedenen Indizes werden die genannten 
Realisierungen bezeichnet. 

Bei der Beschreibung von Algorithmen ist es aber angenehm, ein gewisses kon- 
kretes Verfahren zur Erzeugung einer Folge von Realisierungen &p0g. .. im 
Auge zu haben. Dazu dient eine Rekursionsformel (2.1.5), (2.1.6), in der die Para- 
meter so gewählt wurden, daß die Periode der erhaltenen Folge genügend groß ist 
und die ausgewählten statistischen Teste ein befriedigendes Resultat liefern. Dabei 
ist folgendes zu bemerken. Wenn die Pseudozufallszahlen auf einer Maschine 
erhalten wurden, die im Dualzahlsystem nit » Dualziffern £, arbeitet (gewöhnlich 
ist dann P = 2"), so kann sich die Verteilung der letzten Ziffern wesentlich von ' 
der diskreten P(ß; = 1) = P(ß,; = 0) = 1/2 unterscheiden. Mehr noch, die letzte 
Ziffer dieser Zahlen ist immer gleich 1. Die statistischen Teste, die auf Pseudo- 
zufallszahlen wie auf Realisierungen einer auf [0, 1] gleichverteilten Zufallsgröße 
anwendbar sind, können nichtsdestoweniger befriedigende Ergebnisse liefern, weil 
der Beitrag der letzten Ziffern entsprechend gering ist. Das muß man bei der 
Benutzung einzelner Ziffern von Pseudozufallszahlen sowie bei der Erzeugung von 
Pseudozufallszahlen durch Verschiebung der Ziffern beachten. 

Ist & = (a, ...,x{9) eime im s-dimensionalen Einheitswürfel gleichverteilte 
Zufallsgröße, so kann man für ihre Realisierung eine beliebige unabhängige Aus- 
wahl von s unabhängigen Realisierungen a; der auf [0, 1] gleichverteilten Zufalls- 
größe x nehmen. Analog erhält man Ber Hr der Zufallsgröße «’, die im 
s-dimensionalen Parallelepiped (a, < ; < b;}:-.ı,..,, gleichverteilt ist, indem man 
beispielsweise 


a; = (a + (bi — G)&n nd + as + (db, — Qu) &kıs-ı) 


setzt. Werden dabei für die Prüfung der Qualität der Folge Übereinstimmungs- 
kriterien benutzt, so ist mindestens notwendig, ihre entsprechenden s-dimensionalen 
Verallgemeinerungen zu gebrauchen, um die Nähe zwischen empirischer und 
theoretischer Verteilung zu garantieren (aber nicht die Unabhängigkeit einzelner 
Realisierungen!). 

Will man unabhängige Realisierungen eines im s-dimensionalen Gebiet D des 
euklidischen Raumes gleichverteilten Zufallsvektors erhalten, also eines Zufalls- 
vektors mit der Verteilungsdichte 


1/2) für men n)eD, 


0 sonst 


Pal&ı> +++, %s) -| 


(\D} bezeichnet den Inhalt des Gebietes 2), so geht man gewöhnlich folgendermaßen 
vor. Ist D beschränkt, so kann man D in ein s-dimensionales Parallelepiped 
ia, Sm S b;}:-ı,..,n einbetten. Man nimmt nun eine Folge von Realisierungen 
von &’ und entfernt jene Glieder daraus, die nicht in D liegen. Ausführlicher 
werden wir auf diese Frage im nächsten Paragraphen eingehen. 
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2. Methoden zur Modellierung allgemeiner Verteilungen 


Wir nehmen an, daß es ein Verfahren zur Erzeugung unabhängiger Realisierungen 
einer auf [0, 1] gleichverteilten Zufallsgröße gibt. Dann betrachten wir davon 
ausgehend allgemeine Methoden zur Erzeugung unabhängiger Realisierungen von 
Zufallsgrößen mit gegebenem Verteilungsgesetz. Die theoretischen Grundlagen 
dieser Methoden sind recht einfach. Wir werden sie in Form von Sätzen mit Be- 
weis oder unter Hinweis auf die entsprechende Literatur formulieren. Außerdem 
werden wir Algorithmen betrachten, die für viele Fälle gewisse Bedeutung haben. 

Eine Zufallsgröße & sei durch ihre Verteilungsfunktion F;(x) und entsprechend 
ein Zufallsvektor 2 = (&,,...,&) durch die Verteilungsfunktion Fs(&, ..., 2.) 
gegeben. Dann gilt der 


' Satz 1 (Transformation von N. W. SMIRNow). Genügt & der Gleichung 
& 
Sdr)=a, €= Fra), (2.2.1) 


wobei x eine auf [0, 1] gleichverteilte Zufallsgröße ist, so ist € nach dem Gesetz Fıx) 
verteilt. 
In der Tat gilt 


Pesm=r[ far) < far), 


denn F;() ist eine nichtfallende nichtnegative Funktion. Weil £ Lösung der 
Gleichung (2.2.1) ist, gilt weiter E<x)=P(x< F;(z)). Da aber & auf [0, 1] 
gleichverteilt und 0 < F.(«) S 1 ist, erhält man schließlich Fx(x) = P(x < F;(«)) 


_ Für einen Zufallsvektor gilt ein analoges Resultat. 


Satz 2. Die Zufallsgrößen &, ..., & besitzen die gemeinsame Verteilungsfunktion 
Fz(&, ..., 2), und es gelten die Beziehungen 


\ 


Pa)=Pa<m)=S St SdRslay..2), 
oo 0 
Fa, %)=P&,< 2, |) 
X oo co oo co v2 8 
=E PR AF (3 «> | S-- Far sa] ; 
—oo —oo 
.—1 s—1 


wre En Te ne, BEREITET a ee wie en 


Fi 2%) = PS | 21 ---. %-ı) 


- RER | . R dFa(z,, | ’ 
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Dann sind die Größen £,, ..., &; Lösungen der Folge von Gleichungen 
F,(&) =; Fx(&; &) = Kg ver Fsi(&: ve. &,) —=0s (2.2.2) 


und besitzen F (x, ..., %;) als gemeinsame Verteilungsfunktion. 


Die Gleichungen (2.2.2) heißen auch Umkehrformeln. 
Der Beweis verläuft analog zum Beweis im eindimensionalen Fall. 


Algorithmust). Die Gleichungen (2.2.1) und (2.2.2) haben immer eine ein- 
deutige Lösung, weil F; bzw. F> eine nichtfallende Funktion ist. Ist F; unstetig, 
so muß man zur Berechnung einer bestimmten Lösung die Tatsache benutzen, 
daß F‘; rechtsseitig stetig ist. Praktischerweise stellt man die Lebesgue-Stieltjes- 
Integrale in den Formeln (2.2.1) und (2.2.2) in Gestalt zweier Summanden dar, 
als Lebesguesches Integral und eine dem diskreten Anteil entsprechende Summe. 

Ausführlicher gehen wir auf zwei Fälle der Modellierung einer eindimensionalen 
Zufallsgröße mit Hilfe der Formel (2.2.1) ein: 


dFı(x) 
dx 


€ 
. Spıe)de=a. (2.2.3) 


a) Die Dichte pı(x) = 


existiert. Dann hat (2.2.1) die Gestalt 


Ist eine analytische Berechnung des Integrals möglich, so ergibt sich für die Be- 
stimmung von & im allgemeinen eine transzendente Gleichung. Ohne Kenntnis 
konkreter Eigenschaften der Funktion p; ist es schwer, ein effektives Lösungs- 
verfahren vorzuschlagen. Die Benutzung des Newtonschen Verfahrens beispiels- 
weise kann bei kleinem p; eine zu langsame Konvergenz aufweisen. Noch kompli- 
zierter wird die Aufgabe, wenn das Integral mit einer Quadraturformel näherungs- 
weise berechnet werden muß. Daher kann man sagen, daß Formel (2.2.1) nur in 
hinreichend einfachen Fällen ein effektives Ergebnis liefert. Zum Beispiel erhalten 
wir für die Exponentialverteilung 


je für 2>0, 


pele) = r REN < a. A>6, (2.2.4) 


aus (2.2.3) e#®— 1-— x. Indem man die Größe 1 — x, die auch auf [0, 1] gleich- 
verteilt ist, durch & ersetzt, erhält man 


= — - log. (2.2.5) 


!) Wir setzen der Einfachheit halber voraus, daß sich F; bzw. Fz nur aus einem 
stetigen und einem diskreten Anteil zusammensetzen. Dem Autor ist der Fall unbe- 
kannt, daß bei der Lösung von konkreten Aufgaben die Notwendigkeit entsteht, Ver- 
teilungen mit singulärem Anteil zu modellieren. Es ist auch zu bemerken, daß die 
Unbestimmtheit (auf einer Menge vom Maß Null) bei der Bestimmung der bedingten 
Wahrscheinlichkeit praktisch keine Schwierigkeiten hervorruft. Der Algorithmus muß 
so eingerichtet sein, daß Ereignisse, die der genannten Nullmenge entsprechen, nicht 
eintreten. 
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Es muß aber bemerkt werden, daß bei der Inkaufnahme eines zusätzlichen 
Arbeitsaufwandes die Formeln (2.2.1), (2.2.2) eine Quelle sehr effektiver Algorith- 
men für die Modellierung sein können. Ein großer Rechenaufwand ergibt sich 
durch die Notwendigkeit, die Gleichungen (2.2.1) bzw. (2.2.2) während der Rech- 
nung mehrfach für verschiedene Wertea aus [0, 1] zu lösen. Ist F; eine hinreichend 
glatte Funktion, so kann man diese Gleichung zunächst für eine gewisse konkrete 
Auswahl von x-Werten lösen und eine Tabelle von Werten der Umkehrfunktion 
Fz*(&) aufstellen. Werte für beliebige x können danach durch Interpolation ge- 
funden werden. Analoge Überlegungen sind verständlicherweise auch im mehr- 
dimensionalen Fall gültig. Aber mit dem Wachsen der Dimensionszahl wächst auch 
der Umfang der Tabellen stark an. Allgemein führt eine Erhöhung der Effektivität 
bei der Modellierung in der Regel entweder zu einem größeren Speicherbedarf der 
EDVA oder zur Komplizierung der Programmstruktur und zu einem umfangreiche- 
ren Programm, Eine Ausnahme stellt der Fall dar, daß F7'(«x) durch genügend 
einfache Funktionen gegeben ist, beispielsweise durch Polynome nicht zu hohen 
Grades oder durch rationale Funktionen. Besonders effektiv sind solche Proze- 
duren im mehrdimensionalen Fall, obwohl es nicht allzuviele konkrete Anwendungs- 
beispiele gibt. Derartige Beispiele werden später behandelt. 


b) Es sei & eine diskrete Zufallsgröße, die die Werte 7, mit den Wahrscheinlich- 
keiten 9, 7 =1,2,...) annimmt. Dann folgt aus (2.2.1), daß € =1,, ist, wobei j, 
durch die Ungleichungen 


„-1 jo n—1 
Lm<asip oder 0<a-Emsp (2.2.6) 
gm a y- 


bestimmt ist. Die Ungleichungen (2.2.6) haben eine einfache geometrische Be- 
deutung. Das Intervall [0, 1] wird in Intervalle der Länge p, (N p; = 1) in der 
Reihenfolge der Numerierung der 9, zerlegt. Nun wird j = j, gewählt, wenn «& 
in das entsprechende Intervall fällt. Der Algorithmus erfordert in diesem Fall 
keine weitere Erläuterung. 

In numerischer Hinsicht einfacher ist meistens eine Methode, die vov NEUMANN 
[1] vorgeschlagen hat. Sie wird durch folgende Aussage begründet. 


Satz 3. Es sei p(x) mit e — (v1, ..., %,) eine nichtnegative Funktion, die auf dem 
s-dimensionalen Parallelepiped 


D= {@; Ss %; Ss Diiel.,s 
definiert und dort beschränkt, d.h. g(&) < M, und integrierbar ist. Sind &' = (a1, ..,%,) 
und & unabhängige, auf D bzw. [0, 1] gleichverteilte Zufallsgrößen, so fällt die Dichte 
der bedingten Verteilung 


Pisa; i=1,..,s|pla)> Mo) 


mit cp(x) zusammen, wobei c eine Normierungskonstante ist. 


en 
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Beweis. 


Pu <ausa+4de; i=1..,siple)> Ma) 


2, +42 


2a+AR 1 
=o/S du Sf du, [At ltr nis: Pl 6) > Mi) 
7 E77 


% + dr 2442 


=e SS du S dolle). 


* 


Hierbei bedeutet x(b, ---, £s: (ds --, 6) Z Mt) die charakteristische Funktion der 
Menge von Veränderlichen t,,...,t, für die die Ungleichung lt, ...,t) = Mt 
erfüllt ist. Analog findet man 


co x 1 
ei Sc SS Klin ente: Plte and) > Mi) dt 
© u) 1) 


= Sdt,  S die pltı; te). | 


Daraus folgt dann die Behauptung. 


Algorithmus. Ein Rechenverfahren liegt auf der Hand. Es sei &,,&,, ... die 
ursprüngliche Folge unabhängiger Realisierungen von a. Wir wählen (beispiels- 
weise) nacheinander Gruppen von s + 1 Zahlen: 


Rs 1) +1 #5 Kkt1)(a+1) > keldrsr ‚(2.2.7) 


aus. Wir verwerfen solche Gruppen, für die die Ungleichung 


y(a, +&,— a) ra) +13 + ds + (ds — G;) Kk+1)(s+1)) > Ma+1J(s+1) 
(2.2.8) 


nicht erfüllt ist. Sind k,, Äs,... die Werte k, für die (2.2.8) erfüllt ist, so erhält 
man 
en — 0% + (b, N 4,) Kls+1)-+r > T= 1, 2, 85 


als Komponenten unabhängiger Realisierungen der Zufallsgröße F, die mit der 
Wahrscheinlichkeitsdichte e g(&) verteilt ist. 


Es sei N die Anzahl von Gruppen (2.2.7), für die die Ungleichung (2.2.8) geprüft 
wurde, und es erwies sich dabei, daß N, Gruppen.diese Ungleichung erfüllen. Die 


3 —ı 
Größe lim (N,/N), die offensichtlich gleich [ear IT (b; — 2) ist, heißt Effek- 
N o0 i=1 


tivität der v.-Neumannschen Methode. Sie entspricht dem Verhältnis des im Mittel 
nützlichen Rechenaufwandes zum gesamten Aufwand bei einer Realisierung der 
Zufallsgröße Z. Verfahren zur Erhöhung der Effektivität der v.-Neumannschen 
Methode werden unten untersucht. Es gilt auch die folgende Umkehrung von 
Satz 3 (vgl. Mic#ArLow [1]), die in einigen Fällen nützlich sein kann. Die Be- 
zeichnungen entsprechen denen von Satz 3. 


- 
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Satz 4. Ist Z eine mü der Dichle cp(&) verteilte Zufallsgröße und E für jedes 
Z=z auf |[0,cp(x)] gleichverteilt, so ist der Zufallsvektor (Z,E) in dem durch die 
Ungleichungen 


a Z9 <Sb,.,, Su, Sb, 0<S %4ı S pl 2. 8) > 


bestimmten (s + 1)-dimensionalen Gebiet gleichverteilt. 


Gilt p(®) > e > Oin D, so verläuft der Beweis ähnlich wie der Beweis von Satz 3 
und kann elementar geführt werden. Wird aber p(x) Null, so muß man die Menge 
aller der Punkte von D, in denen das eintritt, ausschließen. Der Satz kann nützlich 
sein bei der Modellierung einer Gleichverteilung in einem komplizierten Gebiet. 
Ein entsprechender Algorithmus ist offensichtlich. 


In vielen Fällen erweisen sich auch verschiedene Verallgemeinerungen der 
v.-Neumannschen Methode als nützlich (Romanowskı [2], Butter [1]). Speziell 
gilt der 


Satz5. Es sei Z ein Zufallsvektor mit der Verteilungsfunktion F(x, ..., %)- 
n eine eindimensionale Zujallsgröße mit der stetigen Verteilungsfunktion G(y), deren 
Werte dem Iniervall [0, M] angehören, und r(&, ..., ©) eine stetige nichtnegative 
Funktion mit sup r(&@)—= M. Dann wird die bedingte Verteilungsfunktion von £ unter 


der Bedingung n <r(Z) durch die Gleichung 
Ha...) = PA se... Su1lrd)>n) 
er f- Sare)) dF(«) (2.2.9) | 
bestimmt, wobei c eine Normierungskonslante ist, die durch 
1 
SS Glr)) Ale) 


c= 


erklärt ist. 
Beweis. Es ist 
P(£, zu... <ulre)> n) 


2% Er oo Et E77 r(®) 
=e fo Sara) Sy (wire) > y)day) =e S“- [Are day). 
Daraus folgt unmittelbar die Behauptung, wenn man berücksichtigt, daß c gleich 
1 
SS dF@) S ya: re) > y) day) 


-X90 0 


gesetzt wird. 
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Der Algorithmus entspricht mit einigen offensichtlichen Veränderungen dem 
Algorithmus der v.-Neumannschen Methode. Ausführlicher betrachten wir einige 
Spezialfälle von Satz 5 und die entsprechenden Algorithmen. 

a) Es sei 2 = £ eine eindimensionale Zufallsgröße mit diskreter Verteilung, die 
die m Werte 7, mit den gleichen Wahrscheinlichkeiten 1/m annimmt. Es ist nun 
eine Zufallsgröße zu modellieren, die dieselben Werte mit den Wahrscheinlich- 
keiten p,; annimmt. Wir wählen als r(x) eine Funktion, die für x = r; durch die 


Gleichung r(r;) = p: definiert ist, und als 7 eine auf [9% m max p, | gleichverteilte 


Zufallsgröße. Weil in diesem Fall @(z) = x/max p; und ce = m. max p: ist, folgt 
aus (2. 2. 9) die Gleichung dH = mr(x) dF(x). ‘ 


Algorithmus. Die Modellierung einer Zufallsgröße, die mit gleichen Wahr- 
scheinlichkeiten m gegebene Werte 7; annimmt, führt auf die Realisierung einer 
ganzen Zahl :, und des ihr zugeordneten 7;,. In diesem Fall wird :, auf folgende 
Weise bestimmt. Die Realisierung x wird mit m multipliziert und der ganze Teil 
der erhaltenen Zahl gleich i, gesetzt. Ist i, bestimmt, so prüft man die Ungleichung 
P,2x max p, und im Fall ihrer Erfüllung ist die Realisierung von & gleich r;.. 


Andernfalls wird ein neuer x-Wert bestimmt und die Rechnung wiederholt. 
Die erhaltene Prozedur ist das diskrete Analogon der v.-Neumannschen Methode. 
Ihre Effektivität, die wie im stetigen Fall definiert wird, ist gleich 1/m - max p:. 


[2 
b) Fz(&) besitzt die Dichte p(®). Dann hat auch H eine Dichte h(#), die durch 
die Gleichung 
h(2) = cp(@) Glr(e)) (2.2.10) 
bestimmt ist. Im eindimensionalen Fall, wenn r(x) = x und auch n Werte aus 
[0, 1] annimmt, ergibt sich 
h(z) = cp(x) @(x). (2.2.11) 
Nehmen wir an, daßa = lundn auf [0, 1] gleichverteilt ist, aber r eine beliebige, 
den Bedingungen von Satz 5 genügende Funktion ist, so gilt 


pe) rl) 
h(x) = rer? (2.2.12) 


unter der Bedingung / g(x) r(x) dx < &. 

In diesem Fall ist es leicht, eine Funktion r(x) zu ermitteln, damit die Gleichung 
(2.2.12) eine gegebene Funktion k bestimmt. Diese Funktion r(x) wird bis auf 
einen konstanten Faktor durch die Gleichung 


> für Aa)>0 und ga)>0, 
r(z) = 


0 sonst 


bestimmt. Ist max (k(&)/p(x)) = 1, so ist c, = 1. Sonst setzen wir voraus, daß 


x 
h(x) beschränkt ist und @(&) der Ungleichung 0 << p(x) für alle x im betrachte- 
ten Gebiet genügt. Dann muß bei der Wahl von c, berücksichtigt werden, daß 
n < list und folglich r(x) den Wert 1 nicht übersteigen soll. Offensichtlich genügt 
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es, c, = min (p(z)/h(x)) zu setzen. Die Effektivität der Methode wird durch das 
E32 


Verhältnis 
1 
S ple) r(e) dx 
bestimmt. 


Es lassen sich leicht weitere Spezialfälle angeben, bei denen die Formel (2.2.9) 
benutzt wird. 


Es ist offensichtlich, daß die v.-Neumannsche Methode mit der Umkehrformel 
kombiniert werden kann. Die Lösung der einen oder anderen Gleichung (bei der 
Umkehrformel) kann ersetzt werden durch die Modellierung der entsprechenden 
eindimensionalen Verteilungen nach der v.-Neumannschen Methode. Die Umkehr- 
formel ihrerseits kann bei der Benutzung von Verallgemeinerungen der v.-Neu- 
mannschen Methode vorteilhaft sein. 

Die folgende Methode, die die Bezeichnung ‚Methode der festen Ordinaten‘“ 
trägt (RomAnowskı [2]) wird durch nachstehenden Satz begründet. 


Satz 6. Es sei r(x) eine nichtnegative, auf dem Intervall [a, b] definierte und dort 
stetige Funktion mit max r(x) = 1. Wählen wir dann eine Realisierung &’ der auf 


67 
[0, 1] gleichverteilten Zufallsgröße & und außerdem von x’ und in der Gesamtheit 


unabhängige Realisierungen &1,&3, . . . der auf [a,b] gleichverteilten Zufallsgröße, bis 
das erste Mal die Ungleichung 
r() > a’ (2.2.13) 
erfüllt ist, so hat x; die Verteilungsdichte') 
r(z) 
px) = il a re dy. (2.2.14) 


ö 
Beweis. Esseir(a;) >«. Dann gilt 
Azim(y) für r@)>y, 


Pessigatdela-n=| } sonst 


wobei m(y) = (b — a)! mes {x : r(&) > y} ist. Daraus ergibt sich 


+42 ri) n 
—q4 
Peso; <x+Aelrke)>0)= [ dx - -dy. 
, ; mes {x : r(2) > y} 


Algorithmus. Man wählt zunächst irgendeine Realisierung vonx und danach 
Realisierungen &1, 3, ... und prüft die Ungleichung &' < r(a;). Ist k, der erste 
k-Wert, für den die genannte Ungleichung erfüllt ist, so wird a;, eine Realisierung 
der mit der Dichte p(x) verteilten Zufallsgröße. 


1) Mit mes wird wie üblich das gewöhnliche Maß einer Menge bezeichnet. 
4 Ermakow, Monte-Carlo-Methode 
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Spezialfall. Ist p(x) monoton, so muß auch r(x) monoton sein. Beide seien 
nun fallend. Dann gilt 


r(x) 
plx) = (b — af I) dy. (2.2.15) 
Für differenzierbare p(x) und r(x) erhalten wir 


p'(&) = (b — a) r’(@) [r!(r(@))]. 


Wegen r!(r(x)) = x — a ergibt sich 


F b—a 
ee 


r’(x) und r(z) - (yaart) de-+tc. 
a 


Da r(x) monoton fällt und max r(x) = 1 ist, können wir r(@a)= 1, d.h. c=1, 


x 
setzen und finden nach partieller Integration 


1 
le - a) pe) — Fe] +1, (2.2.16) 
wobei F(x) die zur Dichte p(x) gehörende Verteilungsfunktion ist. In Einzelfällen 
kann die Formel (2.2.16) als Quelle bequemer Algorithmen dienen, obwohl im 
allgemeinen die notwendige Benutzung von F(x) ihre Anwendung praktisch unbe- 
quem macht. Man kann leicht die Klasse von Verteilungsfunktionen F(x) angeben, 
für die r(x) eine genügend einfache Gestalt hat. 

Es sei dazu a = 0,b = 1 und g(«) eine differenzierbare Funktion, deren Werte 
verhältnismäßig einfach zu berechnen sind. Die Funktion r(«) ist leicht zu berech- 
nen, wenn zp(&) — Fix) = r(x) — 1 = g(x) gesetzt wird. F(x) muß also der Ditffe- 
rentialgleichung xF’(x) — F(x) = g(x) genügen, deren formale Lösung F(«) 
— x f t”?g(t) dt + C ist. Die Modellierung von Verteilungen solcher Art ist nicht 
trivial. 

Im allgemeineren Fall, also ohne die Monotonievoraussetzung über p(x), wird 
die Funktion h-1(y) = mes {w: p(x) >y} eingeführt. Die zugehörige Umkehr- 
funktion h(y) kann als Dichte einer gewissen Zufallsgröße betrachtet werden. 
Da h(x) monoton ist, kann mit ihrer Hilfe unter Benutzung von Formel (2.2.16) 
eine Funktion o(x) konstruiert werden. Wegen o”!(y) = mes {x : r(@) > y} ist 
r(x) = o(h"!(p(x))). Eine weitere Verallgemeinerung des beschriebenen Verfahrens 
besteht in der Einführung einer beliebigen Abszissenverteilung. Ist die Abszisse 
mit der Dichte f(x) verteilt, so erhalten wir für monotone Funktionen die Formel 
(2.2.15) in der Gestalt 


ra) = 


r(2) [ry) -1 
Dia) = [7 hi) a) dy | (2.2.17) 
und die Formel (2.2.16) 
r(e) = p(a) Fı(&) +1 = /p@) hie) de, (2.2.18) 


wobei F,(x) eine Verteilungsfunktion mit der Dichte f,(«) ist. 
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Wir beschäftigen uns nun mit der sogenannten Kompositionsmethode, ohne den 
entsprechenden einfachen Satz zu formulieren. Diese von BUTLER [1] vorgeschla- 
gene Methode ist ein Verfahren zur Erhöhung der Effektivität bei der Modellierung 
von Verteilungen durch Einführung von mehrstufigen Modellierungen und durch 
Zerlegung der zu modellierenden Verteilung in einfachere Verteilungen. Wir 
führen hier die eindimensionale Variante an. Die Verallgemeinerung auf den 
mehrdimensionalen Fall bereitet keine Schwierigkeiten. 

Es sei n eine Zufallsgröße mit der Verteilungsfunktion G(y) und y(x, y) eine 
Familie von Verteilungen, die für jedes x bezüglich einer beliebigen Dichte y 
normiert sind. Wir nehmen an, daß die uns interessierende Dichte p(&) in der 


Gestalt 
px) = S ya, y) dG(y) 


darstellbar ist. Wählen wir nun eine Realisierung n, der Zufallsgröße ) und model- 
lieren damit die Dichte w(x, 79), so erhalten wir eine Realisierung £&, die mit der 
Dichte (x) verteilt ist. BUTLER benutzte diese Methode zur Modellierung einer 
Dichte, die durch eine Reihe mit nichtnegativen Koeffizienten gegeben ist: 


pa) = N au, „>20, 0221. (2.2.19) 
i=0 


Da g(x) normiert ist, gilt 
< 
oo a; 
Ar 
Wählen wir als 7) eine diskrete Zufallsgröße, die die Werte © = 0,1,... mit den 


Wahrscheinlichkeiten a;/(@ + 1) annimmt, und setzen y(x, y) = (y-+ 1) a” 
0<x<l1l, so gilt offenbar 


S va, y) dGKy) -2 a 


=; 


Die Prozedur der Modellierung besteht daher in der Bestimmung einer Realisie- 
rung i der Zufallsgröße 7 und danach in der Modellierung der Dichte (© + 1) x’ 

Oft wird die Kompositionsmethode in folgender Weise angewendet. g(x&) wird 
als Summe von zwei Summanden dargestellt: 


rylR) = Pıpılz) + Papal®) , 
wobei g,(#) und g,(x) normierte Verteilungen sind und 9, >0,, >0,9, +m=1 
gilt. Ist @,(x) eine einfach zu modellierende Dichte, erfordert @,(&) bei der Model- 
lierung einen größeren Aufwand und gilt 9, >79, so spart man beträchtliche 
Rechenarbeit, weil der Algorithmus häufig die Bildung von g,(&) (mit der Wahr- 
scheinlichkeit p,) und selten die von @,(x) erfordert. Diese Überlegungen werden 
auch zur Erhöhung der Effektivität bei der v.-Neumannschen Methode genutzt. 
Ist in diesem Fall die FRHRRNNEN bei der Modellierung ri Dichte p(z) klein, 


so stellt man sie in der Form 2 PıYpılz) mit positiven 9,, 2 pı = 1, dar, wobei 


1 
die g;(x) solche Dichten sind, die entweder nach der v. Nenmannschen Methode 
effektiv zu modellieren sind oder nur mit kleinem Faktor p, vorkommen. Eine 
4* 
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Reihe von Einzelheiten, die die Erhöhung der Effektivität der v.-Neumannschen 
Methode betreffen, kann der Leser in der Arbeit von GoLENKo [1] finden. Im Zu- 
sammenhang mit der Kompositionsmethode erwähnen wir noch eine Arbeit von 


n 
Butter [1], in der die Dichte »(x) in der Form (x) = 3 a:9:(&) yı(x) mit nor- 
i=1 


mierten Dichten g,(&) und 9:(x) yı(x) dargestellt wird. Der Index i der Dichte 
Yl®) wılw) wird, wie oben beschrieben, gefunden, und das Produkt g;(x) yı(®) 
wird mit Hilfe der verallgemeinerten v.-Neumannschen Methode (2.2.9) modelliert. 


$3. Spezielle Methoden zur Modellierung allgemeiner Verteilungen 


Die Einteilung der Modellierungsmethoden in allgemeine und spezielle ist bekannt- 
lich relativ. Die Smirnowtransformation (Umkehrformel), die Methode der kon- 
stanten Ordinaten und andere Methoden, die in $ 2 untersucht wurden, sind zweck- 
mäßigerweise unter Beachtung der Besonderheiten der Verteilungen anzuwenden, 
und die gelungene Anwendung dieser oder jener allgemeinen Methode auf eine 
gegebene Verteilung kann als spezielle Methode betrachtet werden. Zu den allge- 
meinen Methoden rechnen wir solche, die es gestatten, beliebige Verteilungen oder 
eine umfangreiche Klasse von Verteilungen theoretisch zu modellieren. Spezielle 
Methoden sind solche, die auf eine recht enge Klasse oder auf spezielle Verteilungen 
anwendbar sind. Verständlicherweise hat es nur Sinn, solche konkreten Vertei- 
lungen zu betrachten, die oft in realen Aufgaben angetroffen werden, z. B. die 
Poisson- und die Normalverteilung und mit ihnen zusammenhärigende Verteilun- 
gen. Bei der Modellierung von Verteilungen spezieller Art werden in breitem 
Maße von der Wahrscheinlichkeitstheorie her bekannte Beziehungen zwischen den 
Verteilungen von Zufallsgrößen ausgenutzt. Aber auch die Grenzwertsätze und 
einige Formeln der numerischen Analysis werden benutzt. 

Insbesondere werden wir im weiteren die folgenden bekannten Beziehungen 
anwenden (vgl. PROCHORow und Rosanxow [1]). 


1. Ist die Zufallsgröße n eine Funktion der Zufallsgrößen &,..., &, also 
= MH&; ...,&), und @(&; ..., %,) die gemeinsame Verteilungsdichte der &, ..., &, 
so gilt 


Pesznsd= Sf plan X) da das. (2.3.1) 


eSfl2.:.,)E1 


2. Haben die Zufallsgrößen £&,,..., & und 11, ---, 775 die gemeinsamen Verteilungs- 
dichten Ps = (& --,%) bzw. Prlyy +, 9,) und ist = Fils 6), = 1.5, 
eine Transformation mit von Null verschiedener Funktionaldeterminante 


u Mies 


las. 8) 
so sind die Dichten p5 und 97 durch die Beziehung 
Palyı + Yı) = Plfıltıs #05 %a)s vor Falzız oo %0)) DI (2.3.2) 
verknüpft. 
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3. Sind &, und &, unabhängige Zufallsgrößen mit den Dichten p,(«) bzw. p,(x); 
so ist die Verteilungsdichte p{y) der Summe &, + &, gleich (Faltungsformel) 


Du) = SD — ©) Dıla) de. (2.3.3) 


Diese und einige andere Beziehungen erlauben es oft, für die Realisierung einer 
Zufallsgröße & einen unmittelbar einleuchtenden Ausdruck der Form 


E = Mo; ---, &n) (2.3.4) 
zu erhalten. Eine solche Darstellung der Realisierungen von € ist in numerischer 
Hinsicht sehr bequem. Wir werden zunächst besonders einfache Beispiele für die 
Darstellung von & durch eine Formel der Gestalt (2.3.4) anführen. 


Beispiel 1. Aus (2.3.3) folgt unmittelbar, daß &=«&, — &, die Verteilungs- 
dichte 
1—-|2]l für ze[—-l,-+]1], 


0 sonst 


pelx) = | 
besitzt. 
Beispiel 2. Für &® — max (&,, ...,&,) erhält man 
nat für ze[O,1], 
Pre) = 0 sonst. 
In der Tat gilt für &%) = max (a,, &,) 
P&ssr)=Pa, sel >) +P srl, Sa, 


x 1 x 3 x 
= Safe >) r[ Wrede [Bndn. 


„ Analoge Untersuchungen können für beliebiges n und für den Fall 

ER) = min (&, -..,%,) durchgeführt werden. Für &® — min (a,, ..., &.) ergibt sich 
n(l—a)"-t für we[0,1], 

0 sonst . 


Pzm(z) = 


Von G. A. Mıcrartow [1] wurden einzelne Klassen von Zufallsgrößen unter- 
sucht, für deren Modellierung man solche bequemen Formeln der Gestalt (2.3.4) 
benutzen kann. Wir führen hier einige seiner Resultate an. 


Satz 7. Die Verteilungsdichte p(x) sei stetig und monoton fallend für x > 0 
und gleich Null für x < 0 und besitze den nicht notwendig endlichen Grenzwert 


lim o(&)=M. 
z>+0 


Ist die Zufallsgröße n mit der Wahrscheinlichkeitsdichte y(y) = g*\(y), O0 < y<M, 
verteilt und & auf [0, 1] gleichverteilt, so ist die Zufallsgröße 


&=ap”.(n) (2.3.5) 
mit der Dichte g(x) verteilt. 
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Beweis. Es ist klar, daß y(y) auch eine Dichtefunktion ist. (Die Vertauschung 
der Koordinatenachsen ändert nicht den zwischen den Achsen und der Kurve 
y=p(x) eingeschlossenen Flächeninhalt.) Bei festem n = y, ist £ auf dem 
rg [9, @”!(yo)] gleichverteilt. Dann ist aber der zufällige Vektor (&,n) im 
sebiet 


SysMO<Sysey) 
und (vgl. Satz 4) folglich auch im Gebiet 
0<r<n;0<y<pk)) 


gleichverteilt. Nach dem erwähnten Satz 4 bedeutet das aber, daß & mit der 
Dichte &(x) verteilt ist. 


Beispiele. 
1. o(@)=—loga, 0<as1l, =; 
2. plz) =arcoosxe, 0sr<sI1, E=aYl-o}. 


Analogen Charakter trägt der 
Satz 8 (MionarLow [2]). Die Dichte p(x) sei stetig differenzierbar, gleich Null 
für x < 0, und es sei (x) + p’(x) > 0 für x > 0. Dann ist 
yy) = pP) + pw) = Ip) ee”? 


eine Dichtefunktion. Ist n eine mit der Dichte y(y) verteilte Zufallsgröße, so üst 
€E= — logx + n mit der Dichte p(x) verteilt. 


Beweis. 
1. Es ist 


>} 4A 
F y(y) dy = a [ [p(y) + P’y)l dy 
— lim rw dy+ ea] =1+limg(4). 
A> |0 A>x 


Da y(y) > 0 ist, existiert das uneigentliche Integral, oder es ist bestimmt diver- 
gent. Weil aber g(y) eine Dichtefunktion ist, kommt nur p(A) >0 für Am 
in Frage. Dann hat das Integral über » den Wert 1, und y ist auch eine Dichte- 


funktion. 
2. Die Verteilungsdichte von — loga ist e”? (2 > 0). Nach der Faltungsformel 


(2.3.3) findet man für die Dichte p;(t) der Zufallsgröße & 
t t 
Di) = S pipe ev etray = er Ip) TV dy= al), 


was zu beweisen war. 
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Beispiel. 
2(x) = ce-*sinh (2 Ye), 
v(y) = e[e-4 sinh Yy ef eI = c eV y-1® cosh Yy. 


Eine solche Verteilungsdichte hat die Zufallsgröße 7 — (u + y2)”/2, wobei u 
normalverteilt mit dem Erwartungswert Null und der Dispersion Eins ist. Dann 
ist also 


> — log | . (2.3.6) 


Eine prinzipielle Möglichkeit, die Darstellung von Zufallsgrößen in der Form 
(2.3.4) zu untersuchen, gibt Formel (2.3.1). Aber ihre unmittelbare Benutzung 
führt gewöhnlich zu sehr komplizierten Berechnungen. Daher können den Sätzen 7 
und 8 analoge Sätze in konkreten Fällen bedeutendes Interesse beanspruchen. 
Als nächstes betrachten wir nun Methoden zur Modellierung gewisser konkreter 
Verteilungen, die oft in der Praxis vorkommen. 


1. Die Exponentialverteilung. Die entsprechende Dichte ist 


I/(®) exp (-/ 0 a) für 2>0, 
— 0 


0 für 2<0O, 


wobei f(x) eine nichtnegative, über jedem endlichem Intervall [0, €] integrierbare 
Funktion mit 


Pelz) (2.3.7) 


c 
im Sf) d = +% \ 
>00 


ist. 

Mit der Exponentialverteilung eng verknüpft sind die Poissonverteilung und der 
Poissonsche Zufallsprozeß. Die Poissonverteilung ist eine diskrete Verteilung. 
Die entsprechende Zufallsgröße nimmt die Werte «= 0,1,... mit der Wahr- 


i 
scheinlichkeit 2, = 5 e-*an. Der Poissonsche Prozeß ist ein Markoffscher Prozeß 
mit folgender Dichte der Übergangswahrscheinlichkeit: 


Inu — x) exp (-7 10 a) für y2® 


plz, y) = | (2.3.8) 


0 für y<e. 


Die Differenz y — x ist also exponentialverteilt. f(x) heißt Parameter des Poisson- 
schen Prozesses. Ist die Anfangsverteilung auch eine Exponentialverteilung mit 


“N 
dem Parameter f(x), so bildet eine Folge von Summen e: &, n=1,2,..., mit 


I= 
unabhängigen exponentialverteilten &, eine Realisierung des Poissonschen Pro- 
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zesses mit dem Parameter f(x). Ist f(x) = A konstant, dann bereitet die Modellierung 
der Dichte (2.3.7) keine Schwierigkeiten (vgl. (2.2.5)). Ist aber f(x) eine verhältnis- 
mäßig komplizierte Funktion, so führt die Anwendung einer beliebigen allgemeinen 
Methode auf mühevolle numerische Prozeduren. 

In diesem Fall ist die folgende Methode nützlich (CoLemax [1]). Es sei f{x) S A 
— const und & eine mit der Dichte 


Pix) = Aesp(-Aa), 220, 
verteilte Zufollsgröße. €» &,... seien unabhängige Realisierungen von &. Man 
bildet dann {; = 2 & i=1,2,... Mit einer Folge x,,&s,, . ... wird die Erfüllung 


der Ungleichung A a <f(h) geprüft. Ist der erste i-Wert, für den diese Un- 
gleichung erfüllt ist, so o stellt £;, eine Realisierung der mit der Dichte (2.3.8) ver- 
teilten Zufallsgröße dar. Tatsächlich wird die Verteilungsfunktion von £;, durch 
die Gleichung h 


P&,<2)= e: P(E,) 


bestimmt, wobei die E#, Ereignisse sind, die in der Erfüllung einer Reihe von 
Ungleichungen 


E, = {a, > 0(&1),&g > o(2); +, %s-1 > 0(&-1), 8 S 0(l,), 6 S x} 
mit o(x) = f(x)/A bestehen. 


Bei festem &; (& = 2, ..., & = %,) und folglich festem &,, © =1, ..., 8, gilt wegen 
der Unabhängigkeit der a,, ...,&s 


PE, | & =» (=1J], ...,s)} 


Tel > (2 &) [&ı =i% ( = 1. ... u} 


k-1 


x Pla. < e(£ a) RR EL NE s 


-1 


(2) 


Weil die £, unabhängig und identisch mit der Dichte A exp (—Ax;) verteilt sind, 
gilt da 
ı- Eu 
i=1 


Pi.) = S de, S day S dualen) gie + a) 


(Ed &r ‚)Aresp(- A &) (2.3.9) 


k=1 
mit ge) = 1 — o(e). 
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Man setzt nun y; = 2 27 =] ...,s. Weildie x; sich in den Grenzn Oo <u,<x 
i—1 
_ e x, ändern, findet man für die y; die Ungleichung y;_-ı < y; <x. Durch 


Andarınn der Integrationsreihenfolge in (2.3.9) ergibt sich dann 


x Us Ya 
P(E,) = 4° f o(Y;) ti glys-ı) dys-ı Fi alyı) dyı - 


Durch sukzessives Differenzieren verifiziert man leicht, daß 


Vs Ya Vs s—1 


1 
few» an | 0 dy, = G_Di fo dy 
0 0 0 


gilt. Daraus folgt schließlich 


s—1 


x u 

© 4-1 

au<a)= | I) Hm fo dy dy 

ö ö 
y 


- [nn e-4V exp ji — oly)]dytdy 


2 Fi fly) exp -[ fo al ay. 


2. Die eindimensionale Normalverteilung. Es existiert eine umfangreiche Biblio- 
graphie, die sich mit Fragen zur Modellierung der Normalverteilung und damit 
zusammenhängender Verteilungen beschäftigt. Auf die grundlegenden Methoden 
gehen wir anschließend ein. Eine ausführlichere Übersicht findet man in den 
Monographien von GOLENKo [1], Janssox [1], BusLenko u.a. [1]. 

Eine zes von Methoden benutzt den zentralen Grenzwertsatz. Wir betrachten 


die Summe 2 &. Ihr Erwartungswert ist gleich n/2, ihre Dispersion »/12. Folglich 
hat die Z ufallegröße 
12 ” 1 
(n) — _t 2.3.10) 
s n De (« 2 ) 


den Erwartungswert Null und die Dispersion Eins und ihre Verteilung strebt für 
n — co gegen die Normalverteilung. Praktisch kann man annehmen, daß für 
n = 12 eine genügend gute Annäherung an die Normalverteilung erreicht wird. 
Dann hat (2.3.10) die besonders einfache Form 


12 
ga) = 7 —6. (2.3.11) 
i=1 
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Freilich muß man bei der Lösung konkreter Aufgaben berücksichtigen, daß für 
verhältnismäßig große Abweichungen die Größe£('?) keine guten Resultate liefern 
kann. (Für x > 6 verschwindet die Dichte »(x) der Zufallsgröße £42 identisch.) 
Ein gutes Beispiel für eine Aufgabe, in der dieser Umstand sehr wesentlich ist, 
findet sich in der Arbeit von Kurar und FArsscHTeis [1]. In einer Reihe von 
Fällen wird &@® mit einer noch kleineren Anzahl von Summanden benutzt, aber 
man benutzt dann spezielle Transformationen, die genauere Ergebnisse liefern. 
Transformationen solcher Art hat BorscHew [1] untersucht. Eine der einfachsten 
wird durch die Formel 


= En) + en ((Em)3 en 3.) (2.3.12) 


gegeben, wobei &) in (2.3.10) bestimmt wird. In dem Buch von GoLENko [1] 
wird behauptet, daß die Verteilung von 77” bereits für n— 5 der Normalverteilung 
genügend nahe kommt. 

Die Formeln (2.3.10) bis (2.3.12) haben die Gestalt (2.3.4). Zu Formeln dieser 
Art gehören auch Formeln, die anscheinend WIENER als erster betrachtet hat 
(siehe auch Jansson [1], KronMmaL [1]). Sie werden nicht durch den zentralen 
Grenzwertsatz, sondern durch die Beziehung (2.3.2) begründet und haben die Form 


& = y— 2loga, cos (277%,) , n = Y— 2 logo, sin (2x%,) . (2.3.13) 


Die Zufallsgrößen & und n sind unabhängig und normalverteilt. 

Setzt man nämlich «= rcosd, y=rsin® und ist (x, y) die gemeinsame 
Verteilungsdichte von x und y, so sind nach (2.3.2) r und ® mit der Dichte 
ro(r cos d, r sind) verteilt. Ist daher 


1 1 
Pla. Y) = 2,CxP [-5 GE: nl. 


so sind r mit derDichte re””*?, r>0 verteilt und d auf [0, 27] gleichverteilt. Daraus 
folgt unter Beachtung von (2.2.1) unsere Behauptung. Freilich ist die mit der 
Dichte re-""? verteilte Zufallsgröße mit Hilfe der Umkehrformel nicht einfach 
zu modellieren, indem man sie in der Form Y— 2 logo, darstellt. Die Berechnung 
der Quadratwurzel und des Logarithmus sind recht zeitraubende Operationen. 
Man könnte dazu verschiedene Modifikationen der v.-Neumannschen Methode 
benutzen. Analog sind cos (2r&,) und sin (2r7x,) Projektionen des Einheitsvektors, 
dessen Richtung in der Ebene gleichverteilt ist. In Abschnitt 5 werden wir auf 
eine spezielle Methode zur Berechnung der Projektionen solcher Vektoren hin- 
weisen. 


3. Die mehrdimensionale nichtausgeartete Normalverteilung von Zufallsgrößen 
mit dem Erwartungswert Null wird durch die Kovarianzmatrix € = ( (c;)):, ER 
det € + 0, bestimmt. Ihre Dichte ist 


(det O)-112 


1, 
Play. %) = (ar) exp I-zonal, (2.3.14) 
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wobei xT = (2, ...,x,) ein Zeilenvektor und & der entsprechende Spaltenvektor 
sind. Nach (2.3.2) überführt eine nichtsinguläre lineare Transformation der Zufalls- 
größen die Dichte (2.3.14) in eine Dichte derselben Art mit anderer Kovarianz- 
matrix. Weil die Matrix C”! symmetrisch und positiv definit ist, kann sie nach 
dem Verfahren von CHOLESKY (FAnDpEssew und FAppeJEwa [1], S. 181) in der 
Form 88T mit einer Dreiecksmatrix S dargestellt werden (ST ist die zu $ trans- 
ponierte Matrix). Dann ergibt sich 


Ct = (SST)-1 = (STY-19-1 und xeTO-Ie = (Sie) Sie. 


Wir setzen nun y = S’!x, was der linearen Transformation der mit der Dichte 
(2.3.14) verteilten Zufallsgrößen EU, ..., &) entspricht. Dann gilt offenbar 


Plan +) = Elya on y) = (Ar) ?exp (-Z y'y} . (2.3.15) 


Daraus folgt, daß die mit der Dichte & verteilten Zufallsgrößen 7%, ..., 7) un- 
abhängig und normalverteilt mit den Erwartungswerten Null und den Disper- 
sionen Eins sind. Für die Erzeugung einer Realisierung der mehrdimensionalen 
Zufallsgrößen (0, ..., &9) muß man also unabhängige Realisierungen von s ein- 
dimensionalen normalverteilten Zufallsgrößen 7%, ..., 7 verwenden und danach 
die Beziehung = SH ausnutzen, wobei Z und H Vektoren mit den Kompo- 
nenten £®) bzw. n{ sind. 

Die Dreiecksgestalt der Matrix $ erlaubt es, dabei eine beträchtliche Anzahl 
von Speicherplätzen der EDVA zu sparen, wenn s groß ist. 


4. Mit der Normalverteilung verknüpfte Verteilungen. Für eine Reihe von 
Zufallsgrößen,, die unmittelbar durch eine normalverteilte Zufallsgröße ausge- 
drückt werden können, kann auf natürliche Weise ein Algorithmus für die Mo- 
dellierung angegeben werden. Beispiele dafür sind Zufallsgrößen, die eine /-, 5- oder 

4*-Verteilung besitzen (unter bestimmten Einschränkungen für die auftretenden 
ersten). Die Beziehungen zwischen den genannten Verteilungen und der 
Normalverteilung werden in vielen Handbüchern der mathematischen Statistik 
angeführt (z.B. Wırks [1] u.a.). Wir beschränken uns auf die Betrachtung 
zweier konkreter Beispiele. Ausführlicher wird diese Frage in der Arbeit von 
RoMANowsKI [2] untersucht. 


a) Die y?-Verteilung wurde schon in (1.3.6) besprochen. Sind die &; unab- 
hängige, mit a Parametern (0, 1) normalverteilte Zufallsgrößen, so heißt die 


Größe Y = & mit s Freiheitsgraden y?-verteilt. Die Methode ihrer Model- 
X g vi 


lierung erfndert keine besonderen Erläuterungen. Wird für die Modellierung der 
€, die Formel (2.3.13) benutzt, so erhält man für gerades s 


Y = — log (Kı%a so &sj2) (2.3.16) 
und für ungerades s 


X =— log (&ı%g ae &s--1)/2) — log Xs-+1)j2 cos? (20 (s+3)j2) . 
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b) Die Zufallsgröße ß,,, die eine ß-Verteilung mit den Parametern r und s 
(r und s natürliche Zahlen) besitzt, ist durch die Beziehung 
Br. De Bro 
Kar + 2 28 


mit den x%°-Verteilungen verknüpft. Daraus ergibt sich mit (2.3.16) cine Wormel 
zur Erzeugung von Realisierungen der Größe ß,,s: 


log (02 &r+s) 


r, . 2.3.17 
Pr = log (&r 151°" Kr) ( ) 
Die Verteilungsdichte der #,,, ist 
Pr r-+ $) —1 Bu .- 
arl(1 — 2)-1 für x€ [0,1], 
PB. ,(&) = Fir) Ts) ” 10, 1] (2.3.18) 


0 sonst. 


5. Modellierung gleichverteilter Riehtungen im Raum. Die Kugel 6: („)? — 1f4 


mit dem Radius 1 [2 sei ‚eingebettet i in den Einheitswürfel {-1j2s <a0< 1/2}:- PER 
Nun betrachten wir eine Realisierung der Größe «’ (x; = a; — 1/2), die in dem 
Würfel gleichverteilt ist. Zeigt es sich, daß 


8 [Eu] 
(u? > 1/4 (2.3.19) 
i=1 
ist, so wählt man neue, von den vorherigen unabhängigen «; solange, bis die zu 
(2.3.19) entgegengesetzte Ungleichung erfüllt ist. 

Gesucht werden also Vektoren, die vom Koordinatenursprung zum Punkt mit 
den Koordinaten &;, i=1, ..., s, weisen und für die (2.3.19) nicht erfüllt ist. Offen- 
sichtlich ist die Wahrscheinlichkeit, daß Punkte mit den Koordinaten a; in einen 
Kegel, dessen Spitze im Kugelmittelpunkt liegt, fallen, proportional zu dem 
diesem Kegel entsprechenden Raumwinkel. Die Projektionen des gefundenen 
Vektors sind gleich 


a 


8 } 172° 
| Pb () 
i=1 


Einzelheiten und gewisse Modifikationen des Algoritlımus kann man in den 
Arbeiten von Busueneo u.a. [1], S. 134, und von Mürter [2] finden. Die Effek- 
tivität der beschriebenen Methode ist offenbar gleich dem Volumen der s-dimen- 
sionalen Kugel mit dem Radius 1/2. Bei großem s ist dieses Volumen klein. So 
ergeben für s—= 6 nur etwa 2%, aller Versuche ein gewünschtes Resultat. In 
diesen Fällen ist der Übergang zu Polarkoordinaten und die Modellierung der 
entsprechenden Winkelverteilungen zweckmäßig. 

Man könnte die Aufzählung verschiedener Verfahren zur Modellierung kon- 
kreter Verteilungen noch fortsetzen. Wir haben uns aber auf charakteristische 
Verfahren zur Modellierung der in praktischen Anwendungen am weitesten verbrei- 
teten Verteilungen beschränkt. 


= 1, 


$3. Methoden zur Modellierung allgemeiner Verteilungen 61 


Zum Abschluß seien noch einige Bemerkungen zur Modellierung zufälliger 
Prozesse angefügt. 

Es wurden bereits Fragen der Modellierung von Realisierungen eines Poisson- 
schen Prozesses untersucht. Dieser gehört zu den diskreten Markoffschen Pro- 
zessen, deren Modellierung in einer Folge von Modellierungen von Zufallsgrößen 
besteht, die die Übergangswahrscheinlichkeit bestimmen. Bezüglich der Model- 
lierung allgemeinerer zufälliger Prozesse kann man nur folgendes sagen. Für die 
Erzeugung der Realisierung eines zufälligen Prozesses müssen eigentlich alle 
möglichen (darunter auch die unendlichdimensionalen) gemeinsamen Verteilungen 
ihrer Werte modelliert werden. Praktisch können wir allerdings keine Realisierung 
eines unendlichdimensionalen Zufallsvektors erhalten und sind daher gezwungen, 
uns auf einen endlichdimensionalen Vektor mit genügend vielen Komponenten 
zu beschränken. Der dadurch hervorgerufene Fehler hängt vom Charakter der 
konkreten Aufgabe ab und erfordert in jedem Fall eine besondere Untersuchung. 

Sollen durch die Modellierung gewisse Mittelwerte über die Trajektorien des 
Prozesses berechnet werden, so ist der Übergang zu endlichdimensionalen Vertei- 
lungen äquivalent der näherungsweisen Ersetzung eines unendlichfachen Integrals 
durch ein gewöhnliches mehrfaches Integral. Der Fehler hängt dabei von der 
Art der zu integrierenden Funktion ab und nimmt ab, je weniger die Funktion 
von den Variablen mit hohem Index beeinflußt wird. Nach Durchführung der 
entsprechenden Untersuchung und Bestimmung der Dimension des Vektors, der 
der Modellierung zugrunde gelegt wird, kann die Aufgabe prinzipiell mit einer der 
oben beschriebenen Methoden gelöst werden. Dabei kann der Algorithmus der 
Modellierung natürlich sehr kompliziert sein. 

Von bedeutendem Interesse ist die Ausarbeitung spezieller Verfahren zur Mo- 
dellierung einzelner Klassen von zufälligen Prozessen. In dieser Richtung gibt 
es gegenwärtig nur vereinzelte Resultate, die hauptsächlich stationäre Gaußsche 
Prozesse betreffen. 

Wir gehen kurz auf einige dieser Resultate ein. Weil die endlichdimensionalen 
Verteilungen eines Gaußschen Prozesses Normalverteilungen sind, kann man das 
schon beschriebene Verfahren zur Modellierung eines normalverteilten Vektors 
benutzen. Ein solcher Weg scheint unbequem nicht nur wegen der numerischen 
Schwierigkeiten bei der Modellierung eines Vektors hoher Dimension, sondern 
auch, weil es nicht immer möglich ist, die erforderliche Dimension ohne vorberei- 
tende Rechnungen richtig zu bestimmen. Reicht die gewählte Dimension nicht 
aus, so ist eine zusätzliche Rechnung notwendig, die mit der Inversion der ent- 
sprechenden Matrix hoher Ordnung verknüpft ist. Manchmal ist es möglich, diese 
Schwierigkeiten zu umgehen. Beispielsweise kann man bei der Konstruktion der 
Trajektorien einer Brownschen Bewegung (WIENER [1], GeLFAnD, FRoLow und 
TscHENZow [1]) die Dimension der zu modellierenden Zufallsvektoren schrittweise 
ohne zusätzliche Rechnungen erhöhen. 


Es sei £(t) die Trajektorie eines Brownschen Teilchens für << 1 mit &(0)=0. 
Die Trajektorie &(t)| kann durch einen Polygonzug approximiert werden, dessen 
Ecken mit den Punkten 4; =i/2", i=0,1, ..., 2%, zusammenfallen. Zunächst ist zu 
bemerken, daß für » = 1 die Zufallsgröße &(1) normalverteilt ist mit dem Er- 
wartungswert Null (wegen &(0) = 0) und der Dispersion Eins. Ihre Realisierung 
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kann durch eine der früher untersuchten Methoden erhalten werden. Eine Ver- 
größerung der Zahl n zieht keine Neuberechnung der früher erhaltenen Reali- 
sierungen nach sich. Für » = 2 ist &(1/2) normalverteilt mit dem Erwartungswert 
Ben und der Dispersion 1/4. Wurden allgemeiner die Realisierungen &(t’) 
C + w” 


2 


und &(t”’), ’ >t’, erhalten, so ist & ) normatverteitt mit dem Erwartungs- 


Ei) HE”) 


wert —— —— und der Dispersion (t’’ — !’)/2. Dadurch wird es möglich, das 


- 


Intervall [0, 1] sukzessive weiter zu halbieren und einen Polygonzug mit entspre- 
chender Eckenzahl zu konstruieren. Dabei kann die Konvergenz des uns interes- 
sierenden Funktionals auf den Trajektorien gegen seinen. Grenzwert festgestellt 
werden. In der Arbeit von GELFAND u.a. [1] wird ein Beispiel für die Fehlerab- 
schätzung bei einem konkreten Funktional durchgerechnet. 

Rekursive Prozeduren zur Modellierung einiger Klassen von Prozessen werden 
in der Arbeit von SragowırscH [1] angegeben. Besitzt beispielsweise ein statio- 
närer Gaußscher Prozeß eine echt gebrochene rationale Spektraldichtet) 


mit 


Al)=Al+- +AA+4,=4MTUR—Ä): 
k=1 


” 


22% 
Biü)=2°+ BA ++ BA+B=IH0-}); (2.3.20) 
= 


r<8s, Im), >0, 


so wählt man einige At aus und betrachtet die Werte &, = £(t,) des Prozesses in 
den Punkten ti, = k4t. Bei genügend kleinem At nähert die Realisierung einer 
stationären Folge der £,. eine Realisierung des zufälligen Prozesses beliebig gut an. 
Für diese Folge soll die Spektraldichte die Form 

1a) = 1A BeeR) 
haben. Unter der Annahme reeller Prozesse, wobei AA) und Bü) Polynome der 
Gestalt (2.3.20) mit reellen Koeffizienten sind, kann man zeigen: Sind die Null- 
stellen von B(A) betragsmäßig kleiner als 1, so genügen die &, der Differenzen- 
gleichung - 

&s+1 + Bu-ı1derı-ı + + Bokı = Amar + + Aınırı + Aomı » (2.3.21) 
wobei die äs, i= 0, ....,r, und B; j=],...,s — 1, die Koeffizienten der Poly- 
nome A bzw. B und die 7 unabhängige mit dem Erwartungswert Null und der 


„m 


j !) Die Spektraldichteg(}) eines stationären zufälligen Prozesses ist mit seiner Korrela- 
tionsfunktion Rt) = M(£(t) &(t -- 7)) durch folgende Beziehung 


Rt) = few gi) dA 


verknüpft. 
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Dispersion 2rr normalverteilte Größen sind. Es gilt auch die umgekehrte Be- 
hauptung: Genügt die stationäre Folge der &, der Differenzengleichung (2.3.21) 


s—1l _ 
und sind die Nullstellen des Polynoms 4° + 5% Bj)" betragsmäßig kleiner als 1, 
= 0 


so existiert eine Spektraldichte dieser Folge von der Gestalt f(}). 
Wenn also K(r) = ce", $>0, die Korrelationsfunktion des Prozesses ist, 
so ergibt sich für die entsprechende Spektraldichte 


a) =; —— mit A=fe. 


Die Korrelationsfunktion der Folge der &; ist 


R(k) = ce Alklat — en'R 


mit 


e = efät, = = NE R(k)e=' 


Dr 


Es ist leicht zu sehen, daß 


s B® 
A) = gr 
ist und die Gleichung (2.3.21) die Gestalt 
+1 — 08: = Pk (2.3.22) 


annimmt. Die Modellierung besteht in der Erzeugung unabhängiger Realisierungen 
von normalverteilten Zufallsgrößen 77, mit den Parametern (0, 27) und Berech- 
nungen nach der Rekursionsformel (2.3.22). Ist die Spektraldichte in einfache 
Brüche zerlegbar, so kann die Beziehung (2.3.21) durch eine Reihe von Rekur- 
sionsformeln der Art (2.3.22) ersetzt werden. In der Arbeit von SRAGOWITScH 
werden auch Rekursionsbeziehungen für die Modellierung von Diffusionsprozessen 
angegeben. 

Ein anderer Weg zur Modellierung Gaußscher Prozesse wird in der Arbeit von 
Pmranaschwirı [1] untersucht. Dort wird die Aufgabe betrachtet, einen Prozeß 
&(t,o), ast<b, mit gegebener eindimensionaler Verteilungsfunktion f(z, t) 
und Korrelationsfunktion A(i,s) zu modellieren. Dabei ist y = f(z,t) absolut 
stetig und x = fr'(y) die zu / inverse Funktion für festes t. 

Für eine umfangreiche Klasse Gaußscher Prozesse gilt die Darstellung 


&t,o) = fr (D(nkt, o))) , a<ı<sb, (2.3.23) 


mit 
nit, o) = z alu) ED, Dix) = I fr “2 du. 
k=1 f 


VAr \ 2m 
x 
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Die z,(®) sind unabhängige, mit den Parametern (0, 1) normalverteilte Zufalls- 
größen, A, und o, sind die Eigenwerte und Eigenfunktionen der Integralgleichung 


el) = Afr, s)o(s) ds. 


Der Kern dieser Gleichung ist mit der Korrelationsfunktion R(t, s) des Prozesses 
&(t, o) durch eine ziemlich komplizierte Beziehung verknüpft, und zwar ist r(t, s) 
Wurzel der Gleichung 


v(rt, s)) = 0 (2.3.24) 
mit 
y(r )= IL DL (7)) Ko )- exp [-? _ re) dr,dt, 
2 YL- gar 2(1—r?) 
— mit) mis) — Kit, s) o(t) o(s) . (2.3.25) 
Dabei sind m(t) und o?(t) der Erwartungswert und die Dispersion des Prozesses 
&(t, ©). 


Die Darstellung (2.3.23) ist möglich, wenn die Gleichung (2.3.24) eine solche 
Lösung r(t, s) besitzt, daß alle Eigenwerte der oben genannten Integralgleichung 
nichtnegativ sind. Diese Darstellung gestattet es dann, den Gaußschen Prozeß 
mit eindimensionaler Diehte und Korrelationsfunktion zu modellieren. Aber die 
vorausgehende Arbeit, die notwendig ist, um diese Darstellung zu erhalten, kann 
recht kompliziert sein. 

Diese Resultate, die wir ohne ausführliche Erläuterungen anführten, charakteri- 
sieren in genügendem Maß die Spezifik der Aufgaben, die bei der Modellierung 
zufälliger Prozesse entstehen. Der Leser, der sich speziell für diese Fragen interes- 
siert, findet eine Reihe von ergänzenden Ausführungen und Algorithmen auch in 
der Arbeit von FRANKLIs [2]. 


III. SIMULATION 


$1. Durchgang von Strahlung durch Materie 


Wenn man die in den beiden vorhergehenden Kapiteln erworbenen Kenntnisse 
benutzt, kann man eine Reihe praktischer Aufgaben durch Simulation des sto- 
chastischen Modells der betreffenden realen Erscheinung lösen. In diesem Ka- 
pitel werden wir dabei absichtlich formale Schlußweisen oder die Untersuchung 
von Gleichungen der einen oder anderen Erscheinung vermeiden. Als wesentlich 
soll eine Besonderheit der Monte-Carlo-Methode hervorgehoben werden, die in 
folgendem besteht. Ihre Anwendung auf Probleme des Strahlendurchgangs oder 
der Massenbedienung erfordert eigentlich nicht die Formulierung von Integro- 
differentialgleichungen oder Differentialgleichungssystemen. In der Praxis kann 
die Situation entstehen, daß die Formulierung solcher Gleichungen erhebliche 
Schwierigkeiten bereitet und es wünschenswert ist, die Aufgabe ohne analytische 
Untersuchung des stochastischen Modells zu lösen. Allerdings gestattet die 
Benutzung des analytischen Apparates, effektivere Algorithmen zur Lösung der 
Aufgaben aufzustellen, wie wir im weiteren sehen werden. 


Wie bereits bemerkt, ist die Entstehung der Monte-Carlo-Methode eng mit 
Aufgaben zur Berechnung des Strahlendurchgangs durch Materie verknüpft. Viele 
theoretische Fragen der Methode entstanden und entwickelten sich nämlich in 
Verbindung mit diesen Aufgaben. Daher scheint es nützlich, zuerst stochastische 
Modelle des Strahlendurchgangs durch Materie darzustellen. 


Notwendigerweise wird diese Darlegung aber unvollständig sein, weil der Autor 
sich außerstande sieht, in größerem Umfang Fragen der Neutronen- oder y-Strah- 
lenphysik zu behandeln. Im wesentlichen wird das Schema der Modellierung dar- 
gestellt, das allerdings den physikalischen Charakter der Erscheinung wider- 
spiegelt. Wir werden den Begriff ‚Teilchen‘ als Sammelbezeichnung gebrauchen, 
wenn wir Neutronen, y-Quanten oder Protonen meinen. Zunächst stellen wir das 
Schema der Modellierung in allgemeiner und idealisierter Form dar. Es sei ein 
gewisses Volumen D gegeben, das von Atomen eines Stoffes erfüllt und von 
Vakuum umgeben ist. Das Teilchen wird durch seine Lage im Raum r = (x, y, 2), 
die Zeitkoordinate t, die Bewegungsrichtung @ = (uw, v,w) mit 2°?—= 1 und die 
Geschwindigkeit » (oder Energie #) charakterisiert (im Fall der y-Quanten kann 
nur # = hv benutzt werden). Die das Teilchen charakterisierenden Größen wer- 
den also durch einen Punkt in einem siebendimensionalen Phasenraum dargestellt. 
Wir nehmen dabei an (FroLow und TscHExzow [3]), daß 


a) die Konzentration der Teilchen im Körper so klein ist, daß man ihre gegen- 
seitige Wechselwirkung vernachlässigen kann; 


5 Ermakow, Monte-Carlo-Methode 
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b) die Wechselwirkung der Teilchen mit der Materie derart ist, daß die Wahr- 
scheinlichkeit einer bestimmten Wechselwirkung nicht von dem vorhergehenden 
Verhalten der Teilchen abhängt; 

c) die Materie sich im stationären Zustand befindet, d. h., die Dichte des Stoffes 
und Zusammensetzung sich nicht mit der Zeit ändern. 


Unter diesen Voraussetzungen setzt sich der Prozeß aus den unabhängigen 
„Geschichten‘‘ der einzelnen Teilchen zusammen. Durch Verfolgung dieser Ge- 
schichten kann man verschiedene Charakteristiken des Prozesses des Strahlen- 
durchgangs erhalten. Die Geschichte eines Teilchens beginnt mit seiner Ent- 
stehung. Im Gebiet 7’ des Phasenraumes der Teilchenkoordinaten ist die Ver- 
teilungsfunktion f{r, 2, E,t) der Quellen gegeben. Durch Modellierung dieser 
Verteilung im Zeitmoment i, erhalten wir die Anfangskoordinaten r,, 24 Ey % 
des Teilchens. Dann bewegt sich das Teilchen geradlinig und gleichförmig weiter 
bis zum Zusammenstoß mit einem Atomkern der Substanz (bzw. auch mit einem 
Elektron bei y-Quanten). Die Wahrscheinlichkeit eines Stoßes auf dem Weg di 
beträgt &(r, E)di. Die Größe &(r, E) wird für den gegebenen Stoff und den 
gegebenen Teilchentyp experimentell bestimmt (manchmal ist auch eine theore- 


tische Berechnung möglich). Dabei ist I(r, E) = z ei(r) o;(E). Hierbei ist o;(r) 
i=1 


die Dichte des Elements mit der Nummeri (Anzahl der Kerne bzw. Elektronen 
in 1 cm3), o;(E) der mikroskopische Wirkungsquerschnitt für ein Element mit der 
Nummer € und m die Anzahl von Isotopen der chemischen Elemente, die bei der 
Berechnung zu berücksichtigen sind. Für Neutronen ist o; = d;/n, wobei n die 
Anzahl von Atomen in einer einatomigen Schicht mit der Fläche 1 cm? und d; 
die Anzahl von Neutronen ist, die mit dem gegebenen Element unter der Be- 
dingung in Wechselwirkung treten, daß » Neutronen senkrecht zur Schicht einfallen. 
&(r, E) heißt auch totaler makroskopischer Wirkungsquerschnitt für den gegebenen 
Stoff. Die Entfernung], die das Teilchen in der gegebenen Bewegungsrichtung @ ohne 
Wechselwirkung zurücklegt, ist also nach einem Exponentialgesetz mit dem Para- 
meter &(r, E) verteilt: 


Hi)=1-— exp |- fr, +1Q,E) al, (3.1.1) 
0 


wobei r, die Anfangslage des Teilchens ist. Durch Modellierung dieser Exponen- 
tialverteilung finden wir die Weglänge des Teilchens. Es kann sich dabei heraus- 
stellen, daß das Gebiet D von dem Teilchen ohne Wechselwirkung verlassen wird. 
Dann muß seine Geschichte offensiehtlich als beendet betrachtet werden. Gehört 
aber der Punkt mit den Koordinaten 


= F Ul: Yy=U+t dvd; 1 =%+ wol (3.1.2) 


zum Gebiet D, so sind nun mit verschiedenen Wahrscheinlichkeiten verschiedene 
Arten der Wechselwirkung möglich (ein Neutron kann mit Kernen verschiedener 
Elemente zusammenstoßen usw.). Wenn wir diese Wahrscheinlichkeiten kennen, 
dann können wir die entsprechende diskrete Verteilung modellieren und die kon- 
krete Form der stattgefundenen Wechselwirkung bestimmen. Im einfachsten Fall 
gibt es drei Typen von Wechselwirkungen: Streuung, Absorption und Zerfall 
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(Bildung neuer Teilchen). Bei der Streuung ändern sich, grob gesagt, die Be- 
wegungsrichtung des Teilchens und seine Energie. Bei der Absorption wird das 
Teilchen durch den Stoff aufgenommen, und seine Geschichte ist beendet. Beim 
Zerfall entstehen ein oder mehrere neue Teilchen, d.h., es bildet sich eine neue 
(sekundäre) Quelle. 


1. Streuung. Die Streuungswahrscheinlichkeit ist gleich Is,/&. Dabei wird 
der makroskopische Streuquerschnitt Z’y., analog zum totalen Wirkungsquerschnitt 
2 bestimmt. Ir stellt die Summe aller möglichen Arten von Streuung dar. Für 
jeden konkreten Streuungstyp wird die Wahrscheinlichkeitsdichte dafür ange- 
geben, daß sich die Bewegungsrichtung von 2 in 2’ und die Energie von E in 
E’ ändert. Diese Dichte g(@, E —2', E’) heißt Indikatrix der Streuung. Ihre 
Modellierung gibt die Möglichkeit, die neue Bewegungsrichtung und die neue 
Energie des Teilchens zu bestimmen. Von neuem wird dann wieder der Weg 
bestimmt, den das Teilchen gemäß (3.1.1) zurücklegt, d. h., die Berechnung der 
Geschichte des Teilchens besteht aus Operationen vom gleichen Typ. Sie endet, 
wenn das Teilchen das Gebiet D verläßt, absorbiert wird oder zerfällt. Manch- 
mal endet die Rechnung auch, wenn die Energie des Teilchens einen gewissen 
unteren zulässigen Wert En unterschreitet. 


2. Absorption. Ihre Wahrscheinlichkeit beträgt Z4n/&. Die physikalische Natur 
der Absorption kann verschieden sein, aber für uns ist nur wesentlich, daß mit 
der Absorption die Geschichte des Teilchens beendet ist. 


3. Zerfall. Die Wahrscheinlichkeit des Zerfalls wird durch die Größe Lyer/& 
bestimmt. Als Ergebnis des Zerfalls entstehen ein oder mehrere neue Teilchen. 
Die Verteilungsfunktion der Phasenkoordinaten der entstehenden Teilchen ist 
anzugeben; durch die Modellierung werden diese Koordinaten dann berechnet. 
Bei der Entstehung mehrerer Teilchen verzweigt sich der Prozeß, d. h., es müssen 
nun die Geschichten jedes entstandenen Teilchens modelliert werden. Wenn die 
sekundären Teilchen von neuem einen Zerfallsprozeß hervorrufen können, entsteht 
ein „Baum“, von dem alle „Zweige“ betrachtet werden müssen. Spezielle Me- 
thoden zur Untersuchung solcher „Bäume“ sind in der Literatur beschrieben 
(z. B. GoL£exeo [1], FroLow [1]). Es ist noch zu bemerken, daß die Bestimmung 
der Zeitkoordinate t bei bekannter Bewegungsgeschwindigkeit und zurückgelegtem 
Weg keine Mühe macht. 

So stellt sich in groben Zügen das Bild dar, das bei der unmittelbaren Model- 
lierung des Strahlendurchgangs durch Materie entsteht. Die Resultate der Rech- 
nung sind gewöhnlich einige Mittelwerte, beispielsweise die mittlere Anzahl der 
Teilchen, die das Gebiet 2 verlassen, die mittlere Anzahl der absorbierten Teil- 
chen usw. Komplizierter in ihrer Realisierung sind Aufgaben, in denen die Ver- 
teilung der Teilchen in Abhängigkeit von irgendwelchen Charakteristiken (Energie, 
Richtung usw.) zu bestimmen ist. 

Wir gehen ausführlicher auf konkrete Beispiele ein. 


Beispiell. Durchgang von y-Quanten durch Materie. Das Gebiet D sei eine 
Schicht eines homogenen Stoffes, die in zwei Dimensionen als beliebig (unendlich) 
groß angenommen wird und die eine endliche Dicke H in Richtung der z-Achse 


5* 


N; 
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hat. Die Strahlenquelle soll punktförmig und im Innern der Schicht gelegen sein, 
ihre Strahlung sei isotrop und monochromatisch. Mit anderen Worten, die y-Quan- 
ten entstehen alle in demselben Punkt r, mit der festen Energie E, und besitzen 
die gleiche Wahrscheinlichkeit, sich in beliebiger Richtung zu bewegen (Abb. 3.1). 
Die Wirkungsquerscehnitte können in Form von Tabellen gegeben sein (der totale 
Querschnitt Z{E) und der Streuquerschnitt Iy.(E)). Zwischenwerte findet man 
durch Interpolation. (Die verschiedenen Prozesse der Wechselwirkung von 
y-Quanten mit der Materie zerlegen wir in zwei Gruppen — Streuprozesse und 
Absorptionsprozesse. Wenig wahrscheinliche Prozesse lassen wir unberücksichtigt, 
wobei wir insbesondere nur die Streuung der y-Quanten an den Elektronen des 
Stoffes mitrechnen.) Der Algorithmus ist vollständig bestimmt durch die Angabe 


Abb. 3.1 


der Regeln des Übergangs vom Punkt &,= (r„, Q,, E,) zum Punkt #41 
= (Pu+1 Qa+ı, En+ı) des Phasenraumes und besteht in folgendem: 

1. Aus E,„ ergibt sich I(E,) und Zsıu(#,). ä 

2. Wir ermitteln Z,„ı1 = — loga/F(E,) als Länge, die das y-Quant bis zur 
Wechselwirkung mit den Elektronen des Stoffes zurücklegt. 

3. = In+1Un: Yn+ı = Yn+ In +410n Zn =nt In+1Wn- Fällt Zn+1 > H 
oder 2,..ı <. 0 aus, so wird der Austritt des y-Quants aus der Platte registriert. 

4. It O<z,-:ı<H, so ist die Art der Wechselwirkung zu bestimmen. Mit 
der Wahrscheinlichkeit Isu/ findet eine Streuung statt, mit der Wahrscheinlich- 
keit 1 — &yı,/& Absorption, und damit endet die Geschichte dieses y-Quants. 

5. Die Dichte der Wahrscheinlichkeitsverteilung von E„.1, gemessen in Ein- 
heiten mc? (m Elektronenruhemasse, ec Lichtgeschwindigkeit) wird durch die aus 
relativistisch invarianten Beziehungen ableitbare Formel von Kreın-NIsHINA- 
Tamm bestimmt (LEIPUNSKT u.a. [1]): 


En+ı ’ En+1 En 1 1 2 (&-5 )| 
e En | En +7 +27, En+1 r En Enzı 


. 
plän+ıEn) für E, > Ey41 2 Enl(2En+1) > 
0 sonst. 


(3.1.3) 
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Dabei ist C eine von E,„ abhängige Normierungskonstante. In der Arbeit von 
Ist u.a. [1] wird eine bedeutend einfachere Formel angegeben, durch die die 
Werte von E„;ı mit einem Fehler von etwa 5%, in einem großen Bereich der 
Energiewerte E„ berechnet werden: 
Er E, 
- ; t SS = —— nn. 
Ira +2,90 I + 0,5685 8, 


6. Der Kosinus des Streuwinkels wird nach der Formel 


1 1 
c08 du+41ı = 1 +05 i 
in n+ 


bestimmt. Die Abweichung von der ursprünglichen Richtung ist eindeutig durch 
die Energie bestimmt. Der Azimutwinkel ist gleichverteilt. 


Erzı e- 


” 


7. Durch den Winkel 9,,ı und den isotrop verteilten Azimutwinkel wird die 
neue Richtung @2,.., nach der Streuung bestimmt (Abb. 3.2). Die abschließende 
Formel kann man beispielsweise in dem Handbuch von BusLEnko u. a. [1] finden: 


bewyu, — bdv, 


Un+ı = Ion + au, 

bewyun — bdu 3.1.4 
Yn+1 = To + A@ün ( 
wn4ı = — beil — wn)"? + am 


mit a = cos du, b= sin duı1, € = cos (2a), d= sin (27a). Damit ist der 
Algorithmus vollständig beschrieben. 


Abb. 3.2 


Tabellen der Wirkungsquerschnitte für y-Quanten haben verhältnismäßig ge- 
ringen Umfang. Sie werden z. B. in dem Buch von LEIPUSSKI u. a. [1] angegeben. 
Die Winkel- und Energiecharakteristiken können durch verhältnismäßig einfache 
theoretische Formeln erhalten werden. Anders ist das im Fall der Neutronen. 
Die Modellierung des Durchgangs von Neutronen durch Materie erfordert die 
Speicherung einer großen Anzahl von Konstanten. Dabei ist die Winkelverteilung, 
die experimentell bestimmt werden muß, nicht immer genau genug bekannt. Man 
kann annehmen, daß die Mittelwerte, die man gewöhnlich als Resultat der Rech- 
nung erhält, verhältnismäßig wenig von Fehlern in der Winkelverteilung oder 
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anderen weniger wahrscheinlichen Effekten abhängen. Allerdings erfordern diese 
Überlegungen in konkreten Fällen zusätzliche Begründungen, zusätzliche Rech- 
nungen oder Experimente. Bei der beschriebenen Modellierungsmethode gibt es 
keine prinzipiellen Hindernisse, beliebige Mittelwerte des Prozesses zu bestimmen. 
Jedoch läßt sich beispielsweise die mittlere Anzahl von Teilchen, die in ein sehr 
kleines Volumen des Phasenraums fallen, praktisch nicht bestimmen. Denn die 
Wahrscheinlichkeit, dieses Volumen zu treffen, ist klein, und daher sind sehr viele 
Versuche notwendig, um wenigstens ein in dieses Volumen fallendes Teilchen zu 
erhalten. Für die Berechnung kleiner Wahrscheinlichkeiten empfiehlt es sich, 
„tiktive‘‘ Modelle aufzustellen. Als einfaches Beispiel eines fiktiven Modells kann 
das folgende dienen. 

y-Quanten dringen in eine Schicht ein, in der sie stark absorbiert werden. Uns 
interessiert nun die Wahrscheinlichkeit des Durchgangs. Wir nehmen an, daß 
sich auf derselben Trajektorie nicht ein y-Quant, sondern eine Gruppe von N Teil- 
chen bewegt. In einem Punkt der Wechselwirkung werden im Mittel Nyır/& 
Teilchen gestreut und die restlichen absorbiert. Wir führen nun für y-Quanten 
ein sogenanntes „statistisches Gewicht“ P, ein, das bei der Entstehung des Teil- 
chens den Wert Be — 1 hat und im Punkt der n-ten Wechselwirkung den Wert 
Pa= Pa-ı12st(En)/(E,) erhält. Beim Austritt aus der Schicht zählt man nicht 
die Menge der Be y-Quanten, sondern die Summe der Gewichte der 
austretenden Teilchen (die austretenden Teilchen können verschiedenes Gewicht 
haben). Alle y-Quanten liefern so einen Beitrag in der Summe der austretenden 
Teilchen, und von vornherein ist zu erwarten, daß diese Summe recht genau 
berechnet werden kann. Unsere Erwägungen bedürften jedoch noch eines strengen 
Beweises. Die Benutzung ähnlicher Verfahren ohne strenge Begründung kann 
auch zu groben Fehlern führen. 


Beispiel 2. Modellierung des Kernkaskadenprozesses. Ein verhältnismäßig ein- 
faches Beispiel für ein Modell, in dem das primäre Teilchen nach Wechselwirkung 
mit einem Atomkern die Bildung sekundärer Teilchen hervorruft, ist das Modell 
des Kaskadenprozesses. Es gibt verschiedene theoretische Modelle des Atomkerns, 
die in der Regel einige unbestimmte Parameter enthalten. Es ist anzunehmen, 
daß das Modell die Kernreaktionen befriedigend beschreibt, wenn es nicht allzu- 
viele Parameter sind und diese so gewählt wurden, daß eine gute Übereinstimmung 
mit dem Experiment gewährleistet ist. Für die Auswahl der Parameter müssen 
umfangreiche Rechnungen durchgeführt werden. Ein Modell, dessen Parameter 
bestimmt sind, wird dann bei der Lösung verschiedener Aufgaben benutzt, die 
mit Kernreaktionen in Verbindung stehen (z. B. bei Berechnungen, die den 
Strahlenschutz betreffen). 

Es muß gesagt werden, daß die Monte-Carlo-Methode gegenwärtig die einzige 
Methode ist, mit der man Charakteristiken von Kernreaktionen unter genügend 
allgemeinen physikalischen Voraussetzungen erhalten kann. Unter Vernachlässi- 
gung des physikalischen Aspekts (vgl. dazu BERNARDINI, BooTH und LINDENBAUM 
[1]) werden wir die Modellierung von Prozessen mit der Monte-Carlo-Methode 
beschreiben, die bei der Bombardierung von Atomkernen mit sehr energiereichen 
Teilchen (Protonen, Neutronen u. a. mit mehr als 10° EV) vor sich gehen. Dabei 
gehen wir von einem der einfachsten Kernmodelle aus. 


$1. Durchgang von Strahlung durch Materie 71 


Wir nehmen an, daß der Kern eine Kugel vom Radius R darstellt (R ist ein 
Parameter des Modells). Die Nukleonen, aus denen der Kern besteht, bilden ein 
entartetes Fermi-Gas, und die Dichte der Kernmaterie ist im allgemeinen ungleich- 
mäßig. Ein Teilchen, das in den Kern eindringt, stößt mit den Nukleonen des 
Kerns zusammen, wird an ihnen gestreut und kann durch Abgabe eines Teils 
seiner Energie ihren Austritt aus den Grenzen des Kerns hervorrufen. Dann ist 
es nötig, die Trajektorien des eingedrungenen Teilchens (das gestreut wird) und 
der sekundären Nukleonen (die gestoßen wurden) weiter zu verfolgen. Jedes 
Nukleon wird durch seinen Impuls p und seinen Ortsvektor r = (x, y, 2) charak- 
terisiert. 

Die Modellierung besteht aus folgenden aufeinanderfolgenden Schritten: 


1. Es werden die Eintrittskoordinaten des mit gegebener Energie einfallenden 
Teilchens bestimmt. Beispielsweise setzt man x, als mit der Dichte 


2% 
— für »,€e[0, R], 
Dre Nr el A 
0 sonst 
verteilte Zufallsgröße an und „= YR —- 5, =0, w= — L,w= % = 0 (der 


Koordinatenursprung fällt mit dem Mittelpunkt des Kerns zusammen). 

2. Die (freie) Weglänge l eines beliebigen (gestreuten oder gestoßenen) Nukleons 
ohne Zusammenstoß mit anderen Nukleonen wird als exponentialverteilt ange- 
nommen. Der Parameter der Exponentialverteilung ist konstant, wenn die Dichte 
der Kernmaterie konstant ist. Ist das nicht der Fall, so kann das Verteilungs- 
gesetz recht kompliziert sein. Zum Beispiel ist 


Pi<a2)=1- exp a) ft) ar 


mit 

ft = ce {1 + explat (RZ r— N? +)? RM. (3.1.5) 
Dabei sind « und c Konstanten, c hängt von der Energie und Art der Nukleonen 
ab. Weiter ist r = |r|, wobei r der Ortsvektor des Punktes ist, von dem das 
Nukleon herkommt. Die Modellierung einer Zufallsgröße mit einer derartigen 
Dichte kann durch eine in Kap. IL, $ 3, beschriebene Methode verwirklicht werden. 


3. Wenn der (n — 1)-te Zusammenstoß im Punkt r„_ı stattfand (r, ist im 
ersten Schritt definiert) und der Impuls p,_ı bekannt ist, werden die Koordi- 
naten des n-ten Zusammenstoßes in üblicher Weise durch 


Le Dee + An-ıln 


bestimmt. Dabei muß die Bedingung |r,| < R geprüft werden. Wenn diese nicht 
erfüllt ist, bedeutet das, daß das Nukleon den Kern verlassen hat. 


4. Weiter wird dann bestimmt, zwischen welchen Teilchen ein Zusammenstoß 
stattfindet. Ist das ankommende Teilchen ein Proton, so muß man die Wahr- 
scheinlichkeit für den Zusammenstoß mit einem Neutron oder Proton kennen, 
um bestimmen zu können, mit welchem Teilchen der Zusammenstoß erfolgt (man 
vergleiche die Auswahl des Wechselwirkungstyps für y-Quanten). Ist das an- 
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kommende Teilchen ein Neutron, so verfährt man analog, aber die entsprechenden 
Wahrscheinlichkeiten haben im allgemeinen andere Werte. Alle diese Wahrschein- 
lichkeiten müssen tabelliert oder durch eine empirische Formel gegeben sein. Sie 
hängen von den entsprechenden Geschwindigkeiten v der stoßenden Nukleonen 
ab. v ist dabei durch die Formel 


Ipı — Pal 
(Ipı — Pal? + m’)\" 
gegeben, wobei m die Ruhemasse von Proton und Neutron, p, der Impuls des 
einfallenden Teilchens und p, der Impuls des gestoßenen Teilchens ist. Man 
nimmt an, daß die Bewegungsrichtung des getroffenen Nukleons vor dem Zu- 


sammenstoß isotrop ist (gleichwahrscheinlich in allen Richtungen, vgl. Kap. II, 
$ 3) und 9, = |ps| die Verteilungsfunktion 


Pz 
2 
SE exp () dx für p,€ [0, Ep], 
F(p,) == f1 2 


0 für M<O, 

1 für Pa e> E» 
besitzt. Dabei sind! p, und Es gegebene Konstanten (Es ist die Fermienergie). 
5. Der Winkel zwischen den Bewegungsrichtungen der Teilchen nach dem Stoß 
wird durch die gegebene Streuungsindikatrix f‚(z#) bestimmt, wobei u den Kosinus 
des Polwinkels bezüglich des Massenmittelpunktes bedeutet. Der Azimutwinkel 


wird als gleichmäßig verteilt angenommen. Die Gestalt von f, hängt von dem 
benutzten Wechselwirkungsmodell ab. Beispielsweise setzt man 


ha) = la + (1 — u)? +1), 


wobei c, eine Normierungskonstante ist. Die Größen a, und a, hängen von den 
Impulsen des einfallenden und des getroffenen Nukleons ab, genauer, von der 
Größe 


F ? IPpı — Pal 
2 m+ (m? +1Ppı — Pıl 
und sind tabelliert oder durch eine empirische Formel gegeben. 

6. Weiter werden auf Grund der Erhaltungssätze (vgl. dazu BARASCHENKOW 
u.a. [1] und BERNARDIST u. a. [1]) die Energie und die Bewegungsrichtung (also 
der Impuls) beider Teilchen nach dem Stoß in einem mitbewegten Koordinaten- 
system bestimmt. Daraus kann dann die Bewegungsrichtung in einem festen Koordi- 


natensystem bestimmt werden (vgl. Formel (3.1.4)). Setzt man s = (|p, — pl? 
+ m?)\?, so ist 


1/2 
2 
+ | Ms 


m(s? — m?) 


E=s — —— 
ur mim + s) 


. N 2 
=, Bunli4, am], 


wobei E, die Energie des einfallenden Nukleons und E, die Energie des gestoßenen 
Nukleons nach dem Stoß bedeuten. Sind 9, und 9, die entsprechenden Winkel 
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der Abweichung von der ursprünglichen Bewegungsrichtung, so ergibt sich 
cos d, = (qq) [Eıls — m) + sm — m?], 


cos d, = (9)! (s + m) (E, — m), 


9 


wobei qg = | — al! 9 = (Ei — m2)!!? und 9, = (E} — m?)\? die neuen Impulse 
der Nukleonen sind. Der Azimutwinkel wird in den einfachsten Modellen für 
beide Teilchen als gleich @1,2 = $, + fa angenommen, wobei 9, und 9, die Azimut- 
winkel der Teilchen vor dem Zusammenstoß sind. Weil man in Wirklichkeit das 
Modell als zylindersymmetrisch bezüglich der ursprünglichen Bewegungsrichtung 
des Nukleons annehmen kann, kann eine einfachere Formel als (3.1.4) benutzt 
werden. Wir gehen darauf aber nicht näher ein. 

Das Pauliprinzip, das einen Zusammenstoß verbietet, der zu besetzten Zustän- 
den führt, wird durch Prüfung der Bedingungen E, — m > Ea und E, — m > Ev 
berücksichtigt. Bei Nichterfüllung dieser Bedingungen wird der Zusammenstoß 
als nicht stattgefunden gewertet. 

Obwohl die angegebenen Formeln ohne eine gebührende physikalische Begrün- 
dung dem Leser überflüssig scheinen könnten, ist es nützlich, sich den Kompli- 
ziertheitsgrad der Algorithmen klarzumachen. Ohne diese Erkenntnis ist es 
schwer, von den verschiedenen Methoden zur Effektivitätserhöhung der Rech- 
nung zu sprechen. Dabei ist noch zu bemerken, daß wir wie im Fall der y- 
Quanten nur die einfachste Aufgabe betrachtet haben. 


Wir wenden uns nun wieder der Modellierung des Kaskadenprozesses zu. 

In Abb. 3.3 wird durch die fettgedruckte Linie der Weg des ankommenden 
Nukleons im Innern des Kerns schematisch dargestellt. Die punktierten Linien 
stellen die Bewegungsrichtungen der gestoßenen Nukleonen dar. Diese Nukleonen 
können ihrerseits mit anderen Nukleonen des Kerns zusammenstoßen und sekun- 
däre gestoßene Nukleonen bilden, obwohl die Wahrscheinlichkeit dafür gering ist. 
Die Kaskade klingt sehr schnell ab. Ebenso wie das eingedrungene Nukleon 
können auch die gestoßenen Nukleonen den Kern nicht verlassen, wenn ihre 
Energie zu klein geworden ist (sie werden dann durch den Kern absorbiert). Im 
Prozeß der Modellierung wird gewöhnlich zuerst die Trajektorie des ankommenden 
Nukleons berechnet, während die Charakteristiken aller angestoßenen Nukleonen 


Abb. 3.3 
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in bestimmter Reihenfolge in der Maschine gespeichert werden. Dann berechnet 
man die Trajektorie des ersten gestoßenen Nukleons. Wenn es die Möglichkeit 
zur Bildung sekundärer gestoßener Nukleonen gibt, werden ihre Charakteristiken 
ebenfalls gespeichert. Nach Berechnung der Grundtrajektorie wendet man sich 
dann dem ersten sekundären Nukleon zu usw. So wird der ganze Baum der 
Trajektorien bis zum Ende jedes Zweiges berechnet. Im Speicher der EDVA 
wird dabei für die Speicherung der Charakteristiken jedes Zweiges ein entspre- 
chender Platz bereitgestellt (ausführlich wird das bei GoLEnko [1] beschrieben). 

Durch die Modellierung des Kernkaskadenprozesses kann man die Charak- 
teristiken der den Kern verlassenden Nukleonen erhalten. Nachdem diese Nu- 
kleonen den Kern verlassen haben, bleibt er noch in einem angeregten Zustand. 
Es beginnt ein neues Stadium der Kernreaktion (das Verdampfungsstadium). 
Auf die Modellierung dieses Stadiums werden wir nicht eingehen (vgl. dazu z. B. 
BELJAJEW und ZarızYNA [l]). 


4. Einige Bemerkungen zur Realisierung von Algorithmen. Das Modell für den 
Strahlendurchgang durch Materie basiert auf einem stochastischen Modell dieses 
Vorgangs und verschiedenen, experimentell zu ermittelnden Konstanten, die in 
dieses Modell eingehen. Das Rechenprogramm besteht in der Regel aus unab- 
hängigen Blöcken. Dieselben Blöcke können für die Lösung verschiedener Auf- 
gaben benutzt werden. Es ist bequem, nicht irgendein vollständiges Programm 
zu haben, sondern ein System von Blöcken oder Prozeduren, aus denen man ein 
entsprechendes Programm zusammensetzen kann. Eine wichtige Rolle spielt die 
günstige Darstellung von Konstanten, die den Wechselwirkungsprozeß zwischen 
Strahlung und Materie charakterisieren. Daher ist es nützlich, in einem vorberei- 
tenden Schritt empirische Formeln für die Wirkungsquerschnitte und die Streu- 
ungsindikatrix herzuleiten. Eine bequeme Darstellung solcher Abhängigkeiten 
kann die Rechenzeit erheblich verkürzen. Diese hängt wesentlich von der Quali- 
tät des Programms, von einer günstigen Speicherorganisation usw. ab. Haben 
z. B. nicht alle Angaben über die Wirkungsquerschnitte im Operativspeicher der 
EDVA Platz, so muß man die Aufgaben für ein gewisses Energieintervall in den 
Speicher bringen und die Trajektorien nicht nur eines Teilchens, sondern einer 
möglichst großen Anzahl von Teilchen in diesem Energieintervall verfolgen. Da- 
nach werden die Angaben über Wirkungsquerschnitte in den Speicher gebracht, 
die dem angrenzenden Energieintervall entsprechen usw. 


Eine erhebliche Schwierigkeit kann die Aufstellung von Programmen für einen geo- 
metrischen Block bieten, in dem die freie Weglänge eines Teilchens zwischen zwei 
Punkten der Wechselwirkung mit der Materie bestimmt wird, wenn der Körper, in 
dem der Strahlendurchgang betrachtet wird, eine komplizierte geometrische Form hat 
oder aus Teilkörpern verschiedener Stoffe besteht. Für mit der Monte-Carlo-Methode 
zusammenhängende Aufgaben hat die genaue Formulierung und Untersuchung solcher 
Algorithmen eine wesentliche Bedeutung. Obwohl das vorliegende Buch hauptsächlich 
den statistischen Aspekten der Monte-Carlo-Methode gewidmet ist, gehen wir doch im 
Sinne eines Beispiels ausführlicher auf die Herstellung eines genügend allgemeinen 
geometrischen Blocks für die Aufgabenstellung des Strahlendurchgangs durch Materie 
ein (ERMAKOW und PROKOFJEWA [1], KUROPATENKO und Ogızıs [1]). 
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Die Voraussetzungen über die geometrische Gestalt des Körpers, durch den die 
Strahlung geht, bestehen in folgendem. Der Körper wird begrenzt durch eine geschlos- 
sene konvexe Fläche $. Im Innern von $ befinden sich die geschlossenen Flächen S$;, 
die die aus verschiedenen Stoffen bestehenden Volumen V, begrenzen. Für © #j 
haben S, und S; keine gemeinsamen Punkte. Im übrigen ist ihre Lage innerhalb von S 
beliebig. Jeder der Stoffe wird durch den entsprechenden Index charakterisiert. Wir 
nennen eine Fläche, die sich innerhalb von $ befindet, aber nicht innerhalb irgendeiner 
anderen Fläche eine Fläche ersten Ranges. Fläche vom Rang % heißt eine solche, die 
sich innerhalb irgendeiner Fläche vom Rang %k — 1 befindet, aber nicht innerhalb 
einer Fläche von einem Rang größer als k — 1. Wir betrachten eine gewisse Fläche S{” 
vom Rang m. Wir werden annehmen, daß der Index des Materials, aus dem diese Fläche 
besteht, auch dem Körper zukommt, den S{” begrenzt und damit allen jenen Flächen 
vom Rang m + 1, die sich im Innern von ‚S{® befinden. Wenn man die Eigenschaften 
des Materials, aus dem $ besteht, ähnlich den Eigenschaften des Vakuums vorgibt, 
dann kann man, wie leicht zu sehen ist, die Forderung der Konvexität der äußeren 
Fläche im wesentlichen weglassen. Berücksiehtigt man weiter, daß verschiedene $; 
sich nicht schneiden, aber doch beliebig dicht beieinander liegen können, so ist offen- 
sichtlich, daß die beschriebene geometrische Gestalt sehr allgemein ist. 

Die Aufgabe des Blocks besteht nun in folgendem: Ein Teilchen bewegt sich vom 
Punkt mit den Koordinaten (%y, Ya; 27) in Richtung des Einheitsvektors (U, %y, Wy)- 
Es wird angenommen, daß sich der Punkt (%, %n 2,) im Innern von $ befindet. Die 
Gerade f, die dureh die Gleichungen 

sem tu, Yzatıal, = + in 
gegeben ist und längs der sich das Teilchen bewegt, möge die Fläche $, schneiden. 
Dabei können sich die Eigenschaften des Stoffes ändern. 

Man will nun die Länge o:,,:, des Intervalls [7?, 7%] finden, wobei 7? der Schnitt- 
punkt der Fläche $;, mit der Geraden £ und 7? der Schnittpunkt der Fläche $;, mit 
der Geraden £ ist (i, wird so vorausgesetzt, daß die Gerade f zwischen 7? und 77 
keinen Schnittpunkt mit irgendeiner Fläche hat). Der Größe o;,:, wird der Index 
desjenigen Stoffes zugeordnet, der zum Intervall LTR, TR] gehört. Die Bedeutung 
der Indizes p und q wird später klar. 

Die formulierte Aufgabe werden wir die allgemeine nennen. Zu ihrer Lösung gehen 


wir zunächst auf den Fall ein, daß es innerhalb von $ eine einzige Fläche $;, gibt, die 
durch die Gleichungen 


(z, Y z) =0 > = OR; sr; A E) 
und Ungleichungen 
KR, Y: 2) = 0, k= 0,1... M, ’ 


beschrieben wird. Um den Schnittpunkt der Geraden £ mit S;, zu finden, muß man 
die Gleichung 


Klan + Bun, Yan + tun, u + tw) = 0 (3.1.6) 
lösen und diejenigen reellen Lösungen t nehmen, für die auch die Ungleichungen 
gi (zn ugs Yan + ln Zn + tu) =0, #»=0,1..,M;}, 


erfüllt sind. Die erhaltenen Werte 1? I sind die Koordinaten der Schnittpunkte der 
Geraden f mit $;, vom Punkt (%,, Yn; Zn) aus gezählt. Anders ausgedrückt ist die 


Größe m, 5 A ap IE TARHEER N, die Entfernung vom Punkt (%,, Ya; 22) zu einem Schnitt- 
punkt von £ mit $;,. Ist P ) > 0, so befindet sich der entsprechende Schnittpunkt in 
der Bewegungsrichtung des Teilchens. 
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Weiter nehmen wir an: 

a) Berührt die Fläche $;, die Gerade und ist ein gewisser t-Wert mehrfache Wurzel 
der Gleichung (3.1.6) ist, so zählen wir diesen t-Wert zweimal in der Liste der Werte up. 
Dann ist also N;, immer eine gerade Zahl. 

b) Den Fall, daß ein Teil der Geraden £ der Fläche $, angehört, schließen wir von 
der Betrachtung aus. Dazu genügt es in der Regel, eine der Größen 2, Yns Zn: Ups Uns Wn 
um einen kleinen Betrag abzuändern. Unter diesen Annahmen ist die Aufgabe, den 
Intervallen der Geraden f£, die innerhalb und außerhalb von S$;, liegen, verschiedene 
Indizes zuzuordnen, immer lösbar. 

Wir nehmen nun an, daß ein Programm vorhanden ist, das bei gegebener Fläche $;, 
die Größen AP), p= 1,2, ..., N;, berechnet und ihnen irgendeinen Index n;, zuordnet. 
Wir bezeichnen dieses Programm mit x(i,). Weiter wird gezeigt, wie aus diesem Pro- 
gramm r{i) ein Programm gebildet werden kann, das auch die allgemeine Aufgabe 
löst. 

Wir ordnen die Programme x(f) in einer beliebigen aber festen Reihenfolge an 
(z. B. in der Reihenfolge der Numerierung der Fläche IR beginnend mit $ = $,). Wir 
nehmen an, daß die als Ergebnis berechneten Werte ep ) ein eindimensionales Feld im 
Speicher der Maschine bilden. Gleichzeitig wird ein anderes Feld gebildet, das Feld 


der Indizes n,, so daß jedem m ein der Fläche S, zugeordnetes rn; entspricht. 


Der folgende Rechenschritt besteht darin, daß das Feld der Werte 1? ) der Größe 
nach geordnet wird. Die entsprechende Permutation wird gleichzeitig auch bei den 
Indizes vorgenommen, so daß die Beziehung zwischen den ‚LP I und n; erhalten bleibt. 
Nach dieser Änderung der Indizierung werden die Elemente der erhaltenen Felder 
mit {[5j] und n[j], 5 = 1, 2, ..., m, bezeichnet, wobei {[m] der maximale Wert der £[5] 
ist. Die uns interessierenden Entfernungen ßi,,i, werden jetzt mit o; bezeichnet. Sie 
sind gleich der Differenz zwischen zwei benachbarten i[j]. Die Prozedur zur Berech- 
nung der den Größen go; entsprechenden Indizes ist nicht so trivial, wenn man berück- 
siehtigt, daß die Flächen S; ineinander liegen können. Man muß die Felder {[j] und 
n[j] in der Reihenfolge fallender j-Werte bis zum ersten negativen i[j] durchsehen 
und sich dabei die Indizes merken, die allen Flächen entsprechen, innerhalb derer sich 
das Teilchen im gegebenen Moment befindet. 


Wir schreiben den Algorithmus zur Berechnung der Entfernungen 0; und der ihnen 
entsprechenden Indizes als Prozedur in ALGOL 60. Als Parameter der Prozedur 
erscheinen die Dimension m der Felder n[j] und {[j] und die Dimension R des Feldes 
r[i], in dem die Indizes der Flächen gespeichert werden, innerhalb derer sich im gege- 
benen Moment das Teilchen befindet. Wir nehmen an, daß der Fläche $ = S, der 
Index 0 zugeordnet wird, um die Allgemeinheit des Algorithmus zu wahren. 


procedure  Geometry (m, R); 
integer m, R; 
begin integer i,j; real array {[1:m]; 
integer array n[l:m], r[1: R]; 
r[1] := 0; 
for j := m,j — 1 while [5] > 0 do 
begin if [5 — 1] = O then {5 — 1]: 
3] := 5] - 5 — 1; 
it r{1] = 0 A nlj] = 0 then goto A; 
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it. n[j] = r[l] then 
begin for i :—= 1 step 1 until R — 1do [ki] := rk + 1] 
end else 
begin for z::—= 1 step 1 until R — 1do 
{ER —i]:= IR — 1]; Ffl]ı= nlj] 
end; 


n{j]:= rll); 
A : end end Geometry; 


Nach Abarbeitung des Programms befinden sieh die Entfernungen g; in den Speicher- 
plätzen {[j] und die ihnen entsprechenden Indizes in den Plätzen n[j]. Die o; sind von 
i[m] aus in Richtung fallender j bis zum ersten negativen Wert i[j] angeordnet. Einen 
solchen negativen Wert gibt es sicher, da sich der Punkt x,, Ya; 2, im Innern von $ 
befindet. 


$2. Modellierung von Aufgaben der Massenbedienung 


Wie schon in $ 1 beschränken wir uns auf genügend einfache Beispiele. Aufgaben 
der Massenbedienung werden in der Sprache der Wahrscheinlichkeitstheorie for- 
muliert. Daher enthält die mathematische Beschreibung einer solchen Aufgabe 
bereits in impliziter Form die Methode zu ihrer Modellierung. Der analytische 
Apparat der Theorie der Massenbedienung erlaubt bei weitem nicht die Lösung 
aller Aufgaben von praktischem Interesse. Daher hat die Entwicklung von 
Modellierungsmethoden für solche Aufgaben eine große Bedeutung. 


Ein Bedienungssystem wird folgendermaßen charakterisiert: 

a) Durch den Forderungsstrom. Die Natur dieser Forderungen wird nicht be- 
rücksichtigt. Der Strom wird durch die gemeinsame Verteilung der Zeitintervalle 
zwischen dem Eintreffen zweier aufeinanderfolgender Forderungen beschrieben. 

b) Durch eine gewisse Menge von Bedienungsgeräten. Jedes Gerät wird durch 
die Bedienungszeit charakterisiert. Diese Zeit ist eine Zufallsgröße und wird 
durch ihre Verteilungsfunktion charakterisiert. Forderungen, die zu einem Zeit- 
punkt eintreffen, zu dem die Geräte besetzt sind, bilden eine Warteschlange. 


c) Durch die Organisationsfiorm beim Warten und Bedienen. Diese kann auch 
durch eine gewisse Wahrscheinlichkeitsverteilung charakterisiert sein. 


Eine Menge von Bedienungssystemen bildet ein Netz, wenn die aus einem 
System austretenden Forderungen in ein anderes System eintreten. Als ein- 
fachstes, ausführlich untersuchtes Beispiel für ein Bedienungssystem kann ein 
System mit einem Bedienungsgerät betrachtet werden, für das die Zeitintervalle r; 
zwischen zwei unmittelbar hintereinander eintreffenden Forderungen unabhängig 
und mit dem Parameter} exponentialverteilt sind, die Bedienungszeit ebenfalls 
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exponentialverteilt ist mit dem Parameter # und die Forderungen eine Warte- 
schlange in der Reihenfolge des Eintreffens bilden. Das System wird durch die- 
jenigen Wahrscheinlichkeiten p„(t) charakterisiert, daß sich zur Zeit im System 
(d.h. in der Warteschlange und in der Bedienung) n Forderungen befinden. Ist 
Alu < 1, so streben die Wahrscheinlichkeiten p,„(t) für £ — oo gegen einen Grenz- 
wert, der nicht von i abhängt (stationäres Verhalten). In dem beschriebenen Fall 
lösen die analytischen Methoden vollständig die Aufgabe. Im stationären Fall 
kann man eine sehr einfache Formel für die p, erhalten. Ist aber i = ti, nicht 
sehr groß und soll p,(l) vor Einstellung des stationären Verhaltens bestimmt 
werden, so sind die analytischen Formeln bereits recht kompliziert, und eine 
Modellierung scheint sogar bei dieser einfachen Aufgabe vorteilhaft. Man erzeugt 
bei der Modellierung Realisierungen der exponentialverteilten Zufallsgrößen und 
berechnet dann die Anzahl der Forderungen im System zum Zeitpunkt i,. Indem 
man diese Modellierung N-mal mit unabhängigen Folgen von Zufallszahlen durch- 
führt, kann man die Wahrscheinlichkeit p,(i,) abschätzen und ein Histogramm 
für die Verteilung der Anzahl der Forderungen im Moment ti, anfertigen. Weil n 
die Werte von Null bis Unendlich annimmt, ist es praktisch unmöglich, auf diese 
Weise alle p,(t,) (oder auch nur genügend viele) mit befriedigender Genauigkeit 
zu erhalten. Die relative Genauigkeit der p,„(t,) ist, wie meistens, um so größer, 
je größer p„(ty) ist. 

In der Regel berechnet man bei der Modellierung eines Bedienungssystems 
nicht p,„(t), sondern andere Charakteristiken, wie etwa die mittlere Wartezeit in 
der Schlange auf dem Zeitintervall [0, £,] usw. In diesen Fällen betrachtet man 
N unabhängige Abläufe des Systems, jeweils vom Zeitpunkt Null bis zum Zeit- 
punkt i,. Sollen Charakteristiken bestimmt werden, die mit dem stationären Ver- 
halten verknüpft sind, so muß man den Ablauf genügend lange verfolgen. Im 
Grenzfall t — o eines einzelnen Ablaufs werden die Zufallsgrößen, deren Mittel- 
werte berechnet werden, abhängig, was bei der Fehlerabschätzung der Modellierung 
und bei der Herleitung von Schätzungen der uns interessierenden Mittelwerte be- 
rücksichtigt werden muß (Aufgabe B). 

Wir gehen auf diese Frage noch etwas ausführlicher ein. Gegeben ist ein System 
mit k Geräten und Poissonschem Forderungsstrom (d. h., die Zeit zwischen dem 
Eintreffen zweier aufeinanderfolgender Forderungen und die Bedienungszeit an 
jedem Gerät sind exponentialverteilt). Bezüglich der Organisation der Bedienung 
wird angenommen, daß jedes freie Gerät mit der gleichen Wahrscheinlichkeit die 
nächstfolgende Forderung bedient (wenn es einige freie Geräte im Moment des 
Eintreffens einer Forderung gibt). Die Forderungen bilden eine Warteschlange 
in der Reihenfolge ihres Eintreffens. Ein typisches Verhalten, wie sich die Zahl 
der Forderungen im System ändert, ist in Abb. 3.4 dargestellt. 

Uns interessiert nun die Wahrscheinlichkeit dafür, daß Forderungen nicht so- 
fort bedient werden können (Wahrscheinlichkeit des Blockiertseins). In Abb. 3.4 
sind die Forderungen über der punktierten Linie blockiert. Man kann zeigen 
(Cox und Sumıru [1]), daß unter den bezüglich des Systems getroffenen Voraus- 
setzungen das ganze Zeitintervall in unabhängige Etappen zerlegt werden kann, 
jeweils vom Moment des Austritts des Systems aus einem Zustand mit dem 
Index n bis zum Eintritt in einen analogen Zustand. Die Anzahlen der blockierten 
Forderungen auf einer bestimmten Etappe bilden unabhängige Zufallsgrößen. 
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to= 0 t, 197 t 
Abb. 3.4 


Bezeichnet N, die Anzahl der auf der Etappe mit dem Index © eintreffenden 
Forderungen und x; die Anzahl der blockierten Forderungen auf derselben Etappe, 
so ergibt sich für die Häufigkeit des Blockierens auf der i-ten Etappe 9; = nı[N ;., 
i=|],..., M, wobei M die Anzahl der gewählten Etappen ist. Für den einfachsten 
Fall nur eines Bedienungsgerätes kann man zeigen, daß für M — oo die Schätzung 

L 


2 
9 = M-! 5 9, verzerrt ist, obwohl die Schätzung (vgl. Kap. I) 
i=1 


(3.2.1) 


asymptotisch erwartungstreu (unverzerrt) ist. Wird der Forderungsstrom eines 
Systems durch den Parameter? charakterisiert und ist die Verteilungsfunktion 
der Bedienungszeit 1 — exp (—x), so beträgt die Wahrscheinlichkeit des Blockiert- 
seins A/(1 +4). Dagegen ist MD, = 1 — A7!log (1 +2). Die entsprechenden ana- 
lytischen Berechnungen werden beispielsweise in der Arbeit von KABax [1] durch- 
geführt. Eben dort wird auch ein Näherungswert für die Dispersion der Schätzung 
(3.2.1) erhalten. Die Benutzung eines solchen Wertes kann notwendig werden, 
wenn das Zeitintervall im voraus festgelegt wird und man die Mittelwerte ver- 
söhledener Größen auf diesem Intervall abschätzen soll. Dann sind sowohl 


n= E n; wie auch N — E N; Zufallsgrößen. Durch Taylorentwicklung des 
Binalen n/N in der Ungaheng des Mittelwertes erhalten wir 


D (2) _ (M(n))? D(N) D(n) 2M(n) cov (n, N) (3.2.2) 
N (M(N))* (M(N))? (MR)? 

Diesen Ausdruck kann man verwenden, wenn die höheren Momente der Zufalls- 

größen n und N klein sind. Die Schätzung der Größen, die in (3.2.2) eingehen, 

läßt sich im Verlauf der Rechnung recht einfach durchführen. Die Benutzung 

von Überlegungen über die Unabhängigkeit der Etappen kann also bei der Mo- 
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dellierung zu falschen Ergebnissen führen. Eigentlich wird die Wahrscheinlichkeit 
des Blockiertseins in der Zeit [0, oo] durch den Erwartungswert der Zufallsgröße 


= . wenn die i-te Forderung nicht sofort bedient wird, 
0 sonst 


bestimmt. Sind N Forderungen eingetroffen, so erhält man eine erwartungstreue 
und konsistente Schätzung für die Wahrscheinlichkeit des Blockiertseins in der 
Form 


1 
PR (3.2.3) 


Das stimmt mit der Schätzung (3.2.1) überein. Hierbei sind die &, abhängige 
Zufallsgrößen. 

Die Frage, wie eine effektive numerische Prozedur für die Schätzung der Dis- 
persion von (3.2.1) hergeleitet werden kann, behandeln wir in Kapitel VI. 

Wir gehen jetzt auf einen Algorithmus zur Modellierung von solchen Bedie- 
nungssystemen ein, die gewöhnlich in der Bedienungstheorie betrachtet wer- 
den (Krımow [1]). Als typisches Beispiel kann das folgende dienen. Die Mo- 
mente des Eintreffens von Forderungen sind t,, f,, ... Die Größen , = ty — tn-1 
n—= 1,2, ...,i, = 0, werden als unabhängig und identisch mit der Verteilungs- 
funktion A(r,) = A(r) verteilt vorausgesetzt. Sind im Moment des Eintreffens 
1 Geräte frei, so kann die Forderung ein beliebiges davon bevorzugen (etwa das 
Gerät mit der kleinsten mittleren Bedienungszeit). Wir werden annehmen, daß 
die Bedienungszeiten z für jede Forderung und jedes Gerät unabhängig identisch 
mit der Verteilungsfunktion B(z) verteilt sind. Für 1>0 soll die Forderung 
sofort und mit gleicher Wahrscheinlichkeit eines der Geräte besetzen. Für 7 = 0 
reiht sich die Forderung in die Warteschlange ein. Man kann verschiedene Regeln 
für die Bildung einer solchen Schlange betrachten. Einige Forderungen können 
in der Bedienung eine Priorität besitzen. Man kann auch den Fall betrachten, 
daß gewisse Forderungen die Bedienung von früher gekommenen Forderungen 
unterbrechen und das Gerät besetzen. Für unser Beispiel nehmen wir an, daß 
die Forderungen eine Warteschlange in der Reihenfolge ihres Eintreffens bilden. 
Die bedienten Forderungen verlassen das System und bilden dabei den Ausgangs- 
strom. 

Die Modellierung beruht auf der Erzeugung von Realisierungen der Zufalls- 
größen mit den Verteilungsfunktionen A(r) und B(z). Wir erhalten nacheinander 
Momente, in denen Forderungen eintreffen (, = T,%b»=tı + Ta +, In = In-ı + Tr) 
und die Bedienungszeiten z,,2,.... Mit w,„ bezeichnen wir die Wartezeit der 
n-ten Forderung bis zum Beginn der Bedienung. Dann ist „+ 4, der Moment, 
in dem die Bedienung beginnt, und i„ + u, + z„ der Moment, in dem sie beendet 
ist. Wir bezeichnen mit i, + w,,t=],..., k, den Moment, in dem das Gerät 
mit dem Index die Bedienung von Forderungen, die zu den n — 1 zuerst im 
System eingetroffenen gehörten, beendet hat. Mit w,,; bezeichnen wir die Zeit- 
dauer von t„ bis zur Beendigung der Bedienung aller vor dem Moment t„ ge- 
kommenen Forderungen auf dem i-ten Gerät. Dann ist a, = min {wn,1 ..., Wn,k}» 

Der Vektor w, = (Wy,13 »-., %n,x) beschreibt den Zustand, der sich im Ablauf 
der Bedienung auf jedem der Geräte herausbildet. Zu Beginn ist w, bekannt 
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(gewöhnlich ist es der Nullvektor). Während der weiteren Arbeit möge nun das 
Gerät mit dem Index, die n-te Forderung bedienen, also w,,;, = min {13 +. Wn,z}- 
Das wird berücksichtigt, indem man zur i,-ten Komponente die Größe z, addiert. 
Die nächste Änderung erfolgt nach dem Zeitabschnitt r„.,, wenn die folgende 
Forderung eintritt. Wir erhalten w,„.},, indem wir von allen Komponenten von 
w; die Größe r„., subtrahieren (nachdem zur i,-ten Komponente z, addiert 
wurde). Negative Komponenten werden durch Null ersetzt. Eine der minimalen 
Komponenten von %,.ıı (es können einige Komponenten gleichen Wert haben) 
wird als Größe %„.ı ausgewählt. Indem man so die Arbeit des Systems verfolgt, 
kann man verschiedene uns interessierende Charakteristiken bestimmen. Sind 


N 
N Forderungen eingetroffen, so kann der Wert N! 3 u, als Schätzung für die 
k n=1 
mittlere Wartezeit einer Forderung bis zum Bedienungsbeginn dienen. Analog 
konstruiert man Schätzungen für andere Größen (Funktionale). Gewöhnlich in- 
teressiert man sich für solche Größen, wie die mittlere Anzahl der auf Bedienung 
wartenden Forderungen, die mittlere Anzahl der freien Geräte, die mittlere Ver- 
weildauer einer Forderung im System usw. 


Außer der Exponentialverteilung mit konstanten oder zeitabhängigen Para- 
metern begegnet man in der Bedienungstheorie besonders oft der Erlangverteilung 
(Gammaverteilung) und der Hyperexponentialverteilung. Die erste wird durch 
die Parameter k und } charakterisiert (A kann von der Zeit abhängen). Die ent- 
sprechende Wahrscheinlichkeitsdichte ist pj(x,2) = Ale z/(k — 1)!. Es ist 
leicht zu sehen, daß die Summe unabhängiger identisch exponentialverteilter 
Größen (also mit der Dichte Ae”**) eine solche Dichte besitzt. Die zweite wird 
durch die Dichte 

k k 
pa) = N pii;exp(—Aa) mit Wpm=1l, MD>O, ze[0, oo) 
i=1 i=1 
charakterisiert. Ebenso wie die }, können auch die p, von der Zeit abhängen. Für 
die Modellierung der Hyperexponentialverteilung kann man Kompositions- 
methoden gut verwenden. 


Gewöhnlich werden mit der Monte-Carlo-Methode kompliziertere Bedienungs- 
systeme als die oben beschriebenen und Bedienungsnetze modelliert. Die Aus- 
gangsverteilungen müssen dabei, wie auch in den früher beschriebenen Aufgaben 
des Strahlendurchgangs, experimentell hergeleitet und vorher überarbeitet wer- 
den. Wenn man etwa die Bedienung von Fahrgästen durch eine Autobuslinie 
modelliert, dann muß man experimentell die Charakteristiken des Fahrgästestroms 
an jeder Haltestelle bestimmen. Wird die Arbeit eines Hafens modelliert, so 
muß man vorher die Angaben über den Strom der ankommenden Schiffe und die 
Verteilung ihrer Entladungszeit (Bedienung) ermitteln. Oft hat die Aufgabe einen 
ökonomischen Aspekt — man soll feststellen, wie notwendig eine Änderung der 
Charakteristiken (Anzahl) der Bedienungsgeräte oder der Bedienungsordnung ist, 
um die mittlere Bedienungszeit zu verkleinern oder, allgemeiner, eine gewisse 
Kostenfunktion zu minimieren. 


Eine wichtige Rolle spielt bei der Modellierung von Bedienungsaufgaben der 
algorithmische Aspekt. Man soll in einer zweckmäßigen Bezeichnungsweise das 


6 Ermakow, Monte-Carlo-Methode 
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Modell des Systems beschreiben. Hat man es mit einer bestimmten Klasse von 
Systemen zu tun, so kann ein System aus Blöcken oder Prozeduren in einer algo- 
rithmischen Sprache derart gebildet werden, daß schnell Programme für Aufgaben 
der gegebenen Klasse aufgebaut werden können. Zum Zweck der Modellierung wur- 
den auch spezielle algorithmische Sprachen ausgearbeitet (z. B. SIMSKRIPT (vgl. 
MARKOoWITZz u. a. [1]), SIMULA). Damit gibt es zu dieser Frage eine umfangreiche 
und leicht zugängliche Literatur. 


Wir werden nun eines der einfachsten Beispiele für ein reales System betrach- 
ten, in dem eine Modellierung nützlich erscheint. 


Beispiel 1. Bedienung von Werkbänken durch einen Brückenkran. Brücken- 
kräne stellen ein wichtiges Transportmittel beim Maschinenbau dar. Ihre Arbeit 
wird folgendermaßen organisiert: In 5—7 m Höhe über der Werkhalle befinden 
sich einer oder mehrere Brückenkräne. Die Brücke des Kranes, die die Werk- 
halle überspannt, kann sich nur in Längsrichtung bewegen. Der Lasthaken des 
Krans bewegt sich nur in Richtung der Brücke, d.h. quer zur Werkhalle. Die 
gestrichelten Quadrate in Abb. 3.5 sollen Werkbänke darstellen. Diese werden 
durch den Kran bedient. Der Kran muß zu einer Werkbank gelangen und dort 
einige Zeit für die Bedienung aufwenden können, wenn das die Produktion er- 
fordert. Wenn der Kran? die Werkbank B bedient, kann offensichtlich der 


Kran / die Werkbank A nicht bedienen, d. h., die Kräne können sich gegenseitig 
stören. Die Werkbänke stellen also Forderungen und die Kräne sind Bedienungs- 
geräte. Ein Bedienungsgerät ist nicht immer erreichbar, d. h., das Bedienungs- 
system ist nicht vollständig zugänglich. In der gegebenen Aufgabe interessiert 
man sich für die Wahl einer geeigneten Bedienungsordnung und für die optimale 
Anzahl von Kränen, die in der Werkhalle aufzustellen sind. Versuche, eine solche 
Aufgabe mit „‚gesundem Menschenverstand‘ zu lösen, führen gewöhnlich zu groben 
Fehleinschätzungen. Die analytische Lösung einer Aufgabe der Bedienungstheorie 
für unvollständig zugängliche Systeme bietet sogar bei einem Poissonschen For- 
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derungsstrom und exponentiell verteilter Bedienungszeit erhebliche Schwierig- 
keiten. Das Modell dieses Vorgangs ist dagegen recht einfach. Wir legen die 
Bedienungsordnung fest. Es wird z. B. die nächstliegende Werkbank bedient, 
von der eine Forderung gestellt wurde, oder der gegebene Kran bedient nur be- 
stimmte Werkbänke. Wir geben die Anzahl der Kräne und die Koordinaten der 
Werkbänke vor. Ist der Forderungsstrom von jeder Werkbank Poissonsch, so 
ergibt auch die Summe einen Poissonschen Strom. (Im einfachsten Fall stammt 
die nächste Forderung gleichwahrscheinlich von jeder Werkbank.) Das Schema 
des Algorithmus ist recht einfach, so daß ihn der Leser leicht selbst aufstellen 
kann. Soll die Aufgabe nach der optimalen Anzahl der Kräne gelöst werden, so 
muß ein Optimalitätskriterium angegeben werden, das die Kosten einer still- 
stehenden Werkbank und die Arbeitskosten eines Kranes berücksichtigt. Ist k 
die Anzahl der Werkbänke und ! die Anzahl der Kräne, so kann man 


kz, + Iz, 

= 

als ein solches Kriterium ansehen. Dabei sind z, die Ausgaben, die mit dem 
Stillstand einer Werkbank verbunden sind, z, die Ausgaben, die mit dem Betrieb 
eines Kranes verbunden sind, und / ist die mittlere Anzahl der arbeitenden Werk- 
bänke. Die Besonderheit bei der Berechnung besteht darin, daß die Erfüllung 
einer Ungleichung g(l,) > $(l,) geprüft werden muß, d. h., man muß ein genügend 
enges Konfidenzintervall für die Schätzung von g(l) gewährleisten. Hier haben 
Fragen der Dispersionsschätzung erstrangige Bedeutung. 


Methoden der Bedienungstheorie und die entsprechenden Modellierungsmethoden 
finden oft Anwendung in Gebieten, die auf den ersten Blick von der eigentlichen 
Bedienungstheorie weit entfernt liegen. In dieser Beziehung ist folgendes Beispiel 
interessant: 


Beispiel 2. Anwendung auf Aufgaben der seismischen Erkundung. In der 
Arbeit von SOLOTUCHINA u.a. [1] wird ein stochastisches Modell für den Durch- 
gang von Explosionswellen durch Medien aus mehreren Schichten beschrieben. 
Das Modell hat eine wichtige Bedeutung für die seismische Erkundung, bei der 
aus dem Charakter der reflektierten Wellen die Struktur von Lagerstätten beur- 
teilt werden sollen. 

Auf der Erdoberfläche sollen längs einer Geraden Detonationsquellen und 
Empfänger angeordnet sein. (Die Erdoberfläche wird als eben betrachtet.) Durch 
die genannte Gerade wird eine Ebene senkrecht zur Erdoberfläche gelegt und 
der so erhaltene Schnitt betrachtet. 

Die z-Achse ist in das Erdinnere gerichtet, @ sei eine Detonationsquelle, und 
mit E bezeichnen wir Punkte, in denen sich Empfänger befinden. Man nimmt an, 
daß die Schichten, die die Wellen reflektieren, senkrecht zur Schnittebene und 
ihre Grenzen parallel zur x-Achse liegen. Medien solcher Art trifft man in der 
geologischen Praxis in Form von Sedimentgesteinen. 

Besonderes Interesse beanspruchen gewöhnlich ein oder zwei Schichten genügend 
großer Ausdehnung (sie sind nicht in Abb. 3.6 dargestellt). Die an ihnen reflektier- 
ten Wellen liefern nützliche Signale. Außerdem gibt es eine Reihe anderer Schich- 
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Abb. 3.6 


ten, die als Störungsquellen dienen. Die Projektionen ihrer Grenzen auf die 
Schnittebene sind durch die Intervalle A,B; dargestellt. Die Aufklärung des 
Störungscharakters hat große Bedeutung für die Aussonderung der nützlichen 
Signale. 


Wir werden ein Intervall A,B, charakterisieren durch die Länge /;, die Tiefe 
der Lagerstätte z, und die Projektion x; des Punktes A, auf die x-Achse und 
nehmen an: 


1. Die Werte x, bilden einen zufälligen Strom (von Forderungen), und $(x) ist 
gleich der Anzahl der x, auf dem Intervall [0, x]. 

2. Die Zufallsgrößen I; sind identisch verteilt mit der Verteilungsfunktion F,(x) 
= PI<e). 

3. Die Zufallsgrößen 2, 0<Sz,<H, haben die Verteilungsfunktion @(x) 
= P(z; < x). 

4, Die Reflexion geht nach den Regeln der geometrischen Optik vor sich. Die 
reflektierte Welle beschreibt man durch eine bekannte Zeitfunktion, die durch die 
Formel 

0 für t<r, 
Aflt—ı) für I>r 


gegeben wird. Dabei ist r die Zeit bis zum Eintreffen der Welle und A die zufällige 
Amplitude mit gegebener Verteilungsfunktion. 

Es wird auch vorausgesetzt, daß die Größen z,, Z;, A in der Gesamtheit und 
von x; unabhängig sind und das zweite Moment der entsprechenden Verteilungs- 
funktion endlich ist. 

Nimmt man an, daß die x, einen Poissonschen Strom bilden, die I, exponential- 
verteilt und die 2, auf [0, 7] gleichverteilt sind, so scheint die betrachtete Auf- 
gabe den traditionellen Aufgaben der Bedienungstheorie sehr ähnlich zu sein, 
wobei die reflektierten Wellen die Rolle der Bedienungsgeräte übernehmen. 

Die praktische Berechnung ist auf der Grundlage der analytischen Resultate, 
die SOLOTUCHINA u.a. [1] erhalten haben, allerdings nur schwer durchführbar. 


Alt) = | 
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Daher erscheint die unmittelbare Modellierung des Verlaufs der Wellen bequemer. 
Das Schema der Modellierung besteht in folgendem: Entsprechend den gegebenen 
Verteilungsfunktionen wird eine Strukturkarte der Erdrinde aufgestellt, d.h., 
man erhält Realisierungen der Größen 
a i Ban 

Weiter wird die Länge des Weges und damit die Zeit der Verzögerung für die an 
verschiedenen Grenzen reflektierten Wellen bestimmt. Dabei sollen die Ausbrei- 
tungsgeschwindigkeit der Wellen und der Brechungskoeffizient gegebene konstante 
Größen sein. Wir betrachten zunächst die einfache Reflexion der Wellen. Ist CD 
eine zur z-Achse parallele Linie, die das Intervall QZ halbiert (Abb. 3.7), so stellen 
die punktierten Linien, die durch den Schnittpunkt von CD mit einem Intervall 
A,B;, verlaufen, den Weg der entsprechenden Wellen dar. Hat ein Intervall A,B, 
keinen Schnittpunkt mit CD, so gelangt die dort reflektierte Welle nicht zum 
Punkt E. Weil die reflektierenden Schichten für die Wellen teilweise durchlässig 
sind, muß man bei gegebenem Brechungskoeffizienten berücksichtigen, daß sich 
nach der Reflexion die Amplitude der Welle auf den g-ten Teil verringert 
(0<g<s1); die durch die Schicht hindurchgehende Welle setzt ihren Weg fort, 
aber sie kann offenbar nicht mehr den Punkt E erreichen. Die Schicht A,B,, die 
die punktierten Linien schneidet, kann nur die Intensität der Wellen schwächen. 


Abb. 3.7 


Unter etwas komplizierteren Bedingungen können doppelt oder mehrfach reflek- 
tierte Wellen zum Punkt E gelangen (Abb. 3.8). 

Obwohl die Reflexionen und Brechungen einen komplizierten verzweigten Prozeß 
bilden, kann man durch die Bedingung, daß alle Wellen im Punkt E eintreffen 
müssen, nacheinander und verhältnismäßig einfach die einfach, doppelt usw. 
reflektierten Wellen aussondern. 

Die Überlagerung der mit Verzögerung und veränderten Amplituden im Punkt E 
ankommenden Wellen ergibt ein gestörtes Signal, das sich zu dem ursprünglichen 
Signal in # addiert. Mehrfache Realisierung der Struktur der Erdrinde und Be- 
stimmung der Form des Signals erlauben es, allgemeine Eigenschaften der Hinder- 
nisse zu bestimmen, die sich aus den Verteilungsfunktionen der Größen x, z, I 
und A ergeben. 
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Abb. 3.8 


Der Umfang der Rechnungen ist gewöhnlich sehr groß und erfordert die Bestim- 
mung der Abhängigkeit der Ergebnisse von den Parametern der genannten Ver- 
teilungen. Wie man in solchen Fällen den Umfang der Rechnungen verkleinern 
kann, wird in Kapitel V untersucht. 


$3. Einige andere Beispiele und allgemeine Bemerkungen 


Beispiel 1. Modellierung einer Panzerschlacht. Das im folgenden beschriebene 
Beispiel ist der Arbeit von ANDERSsoN [1] entnommen. Diese Arbeit wurde im 
Auftrag der schwedischen Streitkräfte angefertigt. Der Autor nimmt an (wie es 
scheint, nicht ohne Grund), daß auf dem Territorium Schwedens eine Schlacht 
unwahrscheinlich ist, an der mehr als 10 bis 15 Panzer von jeder Seite teilnehmen. 

Es wird angenommen, daß infolge der hohen Schußzahl je Zeiteinheit und der 
großen Wahrscheinlichkeit, auf Entfernungen kleiner als 1,5 km zu treffen, das 
Gefecht sehr schnell abläuft. Dann kann die Bewegung der Panzer während der 
Schlacht vernachlässigt werden. Daher wird ein Modell betrachtet, in dem die 
Panzer von festen Positionen aus schießen und eine Bewegung nur am Anfang 
zulässig ist. 

Das ganze Zeitintervall wird in Intervalle gleicher Länge geteilt. Auf jedem 
Teilintervall wird das „Schlachtfeld“ vollständig durchgemustert, und man be- 
rücksichtigt alle Änderungen, die durch die Wirksamkeit einzelner kämpfender 
Einheiten (also durch Panzer) des Modells hervorgerufen werden. Dabei wird 
angenommen, daß jede Einheit des Modells sich in einem der folgenden Zustände 
befinden kann: 

1. unverletzt; 

2. kann nur noch schießen; 

3. kann sich nur noch bewegen (Zwischenzustand); 

4. ist aus der Front ausgeschieden. 

In einem Zwischenzustand befindet sich eine getroffene, aber noch nicht aus der 
Front ausgeschiedene Einheit. Nach einiger Zeit kann sie in einen der drei vor- 
herigen Zustände übergehen. Außer diesen Zuständen hat jede Einheit noch 
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andere Eigenschaften. Einige von ihnen sind konstant, wie z. B. die Geschwindig- 
keit, andere können sich während der Schlacht ändern, z. B. der Typ der Waffen, 
die im gegebenen Moment benutzt werden, die Schußgeschwindigkeit und einige 
spezielle Charakteristiken (z. B. die Übergangszeit aus dem Zwischenzustand). 

Die Aktivität der Seite A gegenüber der Seite B wird durch die Aktivitäts- 
matrix Ms = (||(m4z(i, j))||) beschrieben. Ihre Elemente können die ganzzahligen 
Werte von O bis 4 annehmen. Bezeichnet A, die i-te Einheit der Seite A und B, 
die j-te Einheit der Seite B, so hat m 4 z(t, 5) die folgenden Werte: 


Maslı, j) = 0 1 2 3 4 
Hat A; die Einheit B, entdeckt ? nein ja ja ja ja 
Hat A; B, als Ziel gewählt ? nein nein ja ja ja 
Hat A; wenigstens einen Schuß auf B, 
abgegeben ? nein nein nein ja ja 
Bewegt sich im gegebenen Moment 
ein Schuß von A; nach B,? nein nein nein nein ja 


So bedeutet etwa m4z(i, j) = 3, daß A; den folgenden Schuß auf B, vorbereitet. 

Die Anfangsphase eines Gefechts ist gewöhnlich sehr wichtig für deren Ausgang, 
insbesondere ist es wichtig, wie schnell die Seiten sich gegenseitig entdecken. Auf 
einem öffenen Platz vollzieht sich dieses Entdecken fast unmittelbar, hinreichend 
viele Panzer nähern sich bis auf Sichtweite. Unter anderen Verhältnissen kann die 
Wahrscheinlichkeit einer Entdeckung von vielen Faktoren abhängen. Steht etwa 
ein Panzer in fester Position getarnt, so ist es schwer, ihn zu entdecken, bevor er 
nicht schießt. Die Schaffung eines adäquaten Modells für das Entdecken erfordert 
gründliche Untersuchungen physikalischer und psychologischer Art. Im betrach- 
teten Modell wird die Entdeckungswahrscheinlichkeit p;; im Zeitintervall (— 4t, t) 
eingeführt unter der Bedingung, daß A; vorher (also in (0, t— At)) B, noch nicht 
entdeckt hat 


_ Ir) (hit) + 85a) K,) At 


N: t 
Pl) ER 
Hierbei ist 
O für I<Xun 
gi,;lt) = | . “ 
1 für t20u5; 


7i,j ist der Moment, in dem die direkte Sichtbarkeit zwischen A, und B, möglich 
wurde; h;(t) ist die Beobachtungsaktivitätsfunktion von A;. Diese Funktion ist 
gleich einer Konstanten bis zum und nach dem Moment i = t,, in dem sie sprung- 
haft wächst. t, ist dabei der Moment, in dem das Erscheinen feindlicher Panzer 
bekannt wird, und bildet sich aus der Zeit i, der ersten Entdeckung des Gegners 
durch die Seite A und einer (zufälligen) Benachrichtigungszeit. S;,,() ist eine 
Funktion, die den Effekt der Entdeckung im Moment t, des k-ten Schusses von B, 
charakterisiert. Abb. 3.9 entspricht dem Fall, daß im Moment t, und £, Schüsse 
abgegeben werden. Die Größe K, berücksichtigt den Tarnungseffekt und d;,; die 
Entfernung zwischen A, und B,. Die Matrix (||(r;,;)||) wird in der Anfangsphase der 
Panzerbewegung aufgestellt. Darin werden die örtlichen Bedingungen, das Vor- 
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handensein von Nebel usw. berücksichtigt. Die Frage, ob die Einheit A, eine 
Einheit B, entdeckt hat, wird also positiv entschieden, wenn p:,;(t) S« wird. 


Die Regeln der Zielauswahl waren im gegebenen Modell deterministisch. Es 
wurden zwei Taktiken angewendet: Eröffnung des Feuers sofort nach Entdeckung 
des Ziels und Eröffnung des Feuers auf Kommando. Die erste Taktik wurde bei 
unerwartetem Kontakt angewendet, die zweite bei rechtzeitiger Vorbereitung des 
Angriffs. Ist das Ziel getroffen oder befindet sich im Übergangszustand, so wurde 
in Übereinstimmung mit den aufgestellten Regeln das Ziel gewechselt. Dabei gab 
esin Abhängigkeit von der gegenseitigen Lage der Gegner verschiedene Prioritäten. 
Der Charakter solcher Prioritäten läßt sich leicht darstellen, aber wir werden 
darauf nicht näher eingehen. 


Abb. 3.9 


Die Wahrscheinlichkeit, das Ziel getroffen zu haben, wurde als Funktion des 
Abstands zwischen den Panzern berechnet. Außerdem hängt sie von der Art 
der Waffe ab, von der Genauigkeit bei der Entfernungsbestimmung und von den 
Ausmaßen des sichtbaren Zieles. Wenn das Ziel getroffen wurde, erfolgte der 
Übergang von einem Zustand in einen anderen. Dafür wurde eine Tabelle der 
Übergangswahrscheinlichkeit in Abhängigkeit von den oben aufgezählten Fak- 
toren für folgende Zustände berechnet: 

1-1, 2—2, 3—B3, 

1—2 N} 2 —4 > 3 —4 ’ 

1-3, 

1-4. 
Die Genauigkeit bei der Entfernungsbestimmung konnte zwischen zwei Stufen 
variieren, die Ausmaße des sichtbaren Zieles hingen von der Zeit ab, die seit dem 
Moment der ersten Sichtbarkeit vergangen war. Dieser Faktor wuchs stufenweise 
und hatte drei verschiedene Werte. Das Zeitintervall zwischen zwei Schüssen 
wurde als Summe von zwei zufälligen Größen mit gegebenem Verteilungsgesetz 
und einem konstanten Summanden (abhängig vom Waffentyp) bestimmt. 


Für das beschriebene Modell wurde ein Programm in FORTRAN II für die 
elektronische Datenverarbeitungsanlage IBM 7090 aufgestellt. Auf jeder Seite 
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durften höchstens 15 Panzer teilnehmen. Die Eingangsdaten bestanden aus etwa 
1000 Zahlen. Die Rechenzeit betrug 18 s bis zum Entscheid eines Gefechts von 15 
gegen 9 Panzer, was einer Gefechtsdauer von 100 s mit einer Schrittweite dt=1s 
entspricht. Um eine bestimmte Vorstellung von den möglichen Resultaten zu 
erhalten, mußte das Gefecht etwa 50mal durchgespielt werden. 


Das beschriebene Beispiel ist charakteristisch für die Lösung von Aufgaben aus 
der Spieltheorie. Es ist leicht einzusehen, daß die analytische Beschreibung und 
Untersuchung ähnlicher Aufgaben praktisch unmöglich ist. 


Beispiel 2. Bestimmen eines Maschinenbelegungsplans für eine technische Bin- 
richtung. Wir betrachten ein Fließband, das für den Guß von Werkstücken be- 
stimmt ist. In Abb. 3.10 bedeutet F eine Formgebungsmaschine, auf der die 
Formen für den Guß vorbereitet werden. Die fertigen Formen, die für den Guß 
einer oder mehrerer Werkstücke bestimmt sind, werden auf dem Band in Pfeil- 
richtung bewegt. Der Buchstabe $ bezeichnet den Schmelzofen. Das Metall aus 
dem Öfen fließt in die Formen, die danach vom Band heruntergenommen werden 
und in die weitere Verarbeitung eintreten. Im Verlauf einer Schicht können Guß- 
stücke verschiedener Typen produziert werden. Wir bezeichnen mitm; @ = 1, ...,n) 


F F 
F 


Abb. 3.10 


die Anzahl der Stücke vom i-ten Typ, mit p; das Metallvolumen eines Stücks 
vom i-ten Typ, mit p die Kapazität des Ofens in einer Schicht und mit i, die For- 
mungszeit für ein Stück vom i-ten Typ. Es ist notwendig, daß die Kapazität der 
Öfen und der formgebenden Maschinen in Übereinstimmung stehen. Andernfalls 
kann es zu einem unproduktiven Stillstand der formgebenden Maschinen kommen, 
oder aber das Metall reicht nicht. Dabei ist noch zu berücksichtigen, daß ein ge- 
wisser Rückstand von Metall (etwa R kg) im Ofen bleiben kann und der Übergang 
von der Formung eines Werkstücktyps auf einen anderen eine gewisse Zeit t erfor- 
dert. 
Wir nehmen an, daß die Ungleichungen 


n a 
Spmsp und YVtim; +nrskT (3.3.1) 

i=1 i-1 
erfüllt sind, wobei k die Anzahl der formgebenden Maschinen und 7 deren Arbeits- 


zeit bedeutet. Es soll eine solche Folge von Formgebungen eines Loses von Werk- 
stücken für jede Maschine ausgewählt werden, daß 
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1. es keinen Stillstand der formgebenden Maschinen gibt; 

2. das Metall ausreicht (d. h., es kommt zu keiner Warteschlange von Formen 
vor dem Ofen); 

3. der Rückstand von Metall minimal ist und niemals R übersteigt. 

Abb. 3.11 stellt eine Situation dar, die bei der Arbeit nur einer formgebenden 
Maschine entsteht. Das erste Los enthält ein Stück mit höherem Metallvolumen, 
und der Metallverbrauch übersteigt das mittlere Niveau. Die folgenden Lose 
haben dagegen ein niedrigeres Metallvolumen, und wenn sie gegossen werden, 


Kapazität des Ofens 


Abb. 3.11 


bildet sich ein gewisser Metallvorrat. Gibt es nur eine formgebende Maschine, so 
sollte man die Arbeit mit Stücken kleinen Metallvolumens beginnen, und wenn 
sich genügend Metall angesammelt hat, kann man Formen höheren Metallvolumens 
gießen. Gibt es dagegen mehrere formgebende Maschinen, so kann ein Metall- 
mehrverbrauch, der durch Lose einer formgebenden Maschine hervorgerufen wird, 
durch kleines Metallvolumen der Lose einer anderen ausgeglichen werden. Bei 
großer Anzahl von Losen und von formgebenden Maschinen ist die Aufgabe recht 
kompliziert. Man kann versuchen, sie mit der Monte-Carlo-Methode zu lösen, 
die im gegebenen Fall auf die Konstruktion einer zufälligen Folge von Losen und 
auf die Prüfung von deren Zulässigkeit führt. Eine solche zufällige Folge kann 
folgendermaßen gebildet werden. 

Man wählt eine Zufallszahla,. Der ganze Teil der Zahln«, bezeichnet die Nummer 
des Loses, das als erstes auf der ersten formgebenden Maschine bearbeitet werden 
soll. Danach wählt man x,. Der ganze Teil der Zahl (n — 1), wird die Nummer 
des Loses (unter den verbliebenen Losen), das als erstes für die zweite formgebende 
Maschine genommen wird, usw. Indem man so eine Reihenfolge der Lose herstellt, 
erhält man einen gewissen Plan. Schon nach der Wahl des ersten Loses für jede 
Maschine kann man die Zulässigkeit des Planes beurteilen und die weitere Auswahl 
verkürzen, wenn die Bedingungen 1.—3. auf einem gewissen Zeitintervall nicht 
erfüllt sind. Bei solcher Vorgehensweise kann man erfolgreich sein, wenn es in 
der Menge der angeordneten Lose genügend viele gibt, die unseren Forderungen 
genügen, d. h., wenn die Wahrscheinlichkeit verhältnismäßig groß ist, in der Menge 
aller Pläne einen zulässigen Plan zu finden (wobei jeder Plan mit der gleichen Wahr- 
scheinlichkeit gewählt wird). 

Es ist leicht zu sehen, daß die gleichwahrscheinliche Auswahl nicht die besten 
Vorgehensweise darstellt. Gibt es zwei formgebende Maschinen und wurde auf 


$ 3. Einige andere Beispiele und allgemeine Bemerkungen 9 


der ersten ein Los mit großem Metallvolumen gewählt, so sollte man offensichtlich 
in derselben Zeit auf der zweiten ein Los mit kleinem Metallvolumen wählen. Diese 
Überlegung wie auch andere Überlegungen solcher Art kann man berücksichtigen, 
indem man gewissen Loskombinationen eine große Wahrscheinlichkeit zuordnet 
und die Auswahl der Folgen entsprechend dieser Wahrscheinlichkeitsverteilung 
organisiert. Die einfachste Methode besteht darin, daß man im Fall von zwei 
Maschinen auf die erste Maschine vorzugsweise Lose mit großem Metallvolumen 
und auf die zweite Lose mit kleinem Metallvolumen nimmt. Als Grenzfall erscheint 
der Fall, daß wir genau wissen, wie ein zulässiger Plan zu konstruieren ist, der dann 
die Wahrscheinlichkeit 1 bekommt. 


Die beschriebene Aufgabe ist nicht in allen Einzelheiten formalisiert. Die Monte- 
Carlo-Methode kann in diesem Beispiel den Erfolg nicht in allen Fällen garantieren. 
Gelingt es uns aber, eine befriedigende Lösung zu finden, so ist die Nützlichkeit 
dieser Methode nicht zu bezweifeln. Besonders wertvoll ist die Möglichkeit, bei 
der beschriebenen Methode auch intuitive Überlegungen berücksichtigen zu können. 
Offensichtlich wäre unser Überblick über die Anwendungen der Monte-Carlo- 
Methode unvollständig gewesen, wenn wir die Beschreibung von Anwendungen 
dieser Art weggelassen hätten. 


Es ist leicht, weitere Beispiele zu finden, in denen die Modellierung von Ver- 
teilungen für die Untersuchung realer Erscheinungen ausgenutzt wird. Wir be- 
gnügen uns mit der kleinen Anzahl der aufgezählten Beispiele, weil einerseits die 
unmittelbare Modellierung und die Struktur von Modellen nicht Hauptanliegen 
des Buches sind und es andererseits eine genügend umfangreiche und gut zugäng- 
liche Literatur zu diesen Fragen gibt. So werden eine Reihe von Modellen in den 
Büchern von BusLe£xko [1], [2] besprochen. Im Kapitel XVII des ersten Buches 
von BUSLENKO ist ein ausgezeichnetes Beispiel für die Modellierung der Arbeit 
eines Hafens enthalten, das aus dem Artikel von Star und Pacz [1] entnommen 
wurde. In der Monographie von KLımow [1] werden ziemlich ausführlich Probleme 
der Modellierung komplizierter realer Bedienungssysteme erörtert. Der Modellie- 
rung von Bedienungssystemen ist auch das Kapitel X der Monographie von KAvr- 
MANN und Örvox [1] gewidmet. Zu nennen wäre auch die umfangreiche Mono- 
graphie von CHororac [1], die allgemeinen Fragen der Modellierung gewidmet ist, 
sowie der Sammelband „Methoden der numerischen Physik“, in dem sich viele 
Arbeiten mit der Anwendung der Monte-Carlo-Methode auf physikalische Auf- 
gaben beschäftigen. Diese Liste ist bei weitem nicht vollständig und enthält 
nur solche Arbeiten, die eine Beziehung zu den aufgezählten Beispielen haben. 


Wie schon bemerkt, stellten wir uns in diesem Kapitel nicht das Ziel, die mathe- 
matische Untersuchung der zu modellierenden zufälligen Prozesse vorzunehmen, 
und speziell haben wir betont, daß eine solche Untersuchung in bestimmten Maße 
die Modellierung selbst ersetzen kann. Ein solches ‚‚experimentelles“‘ Vorgehen 
rückt zwei Fragen in den Vordergrund: die Frage nach vorteilhaften Algorithmen 
für die Modellierung, die wir im zweiten Kapitel betrachteten, und die Frage nach 
einer bequemen Beschreibung der Modellstruktur. Teilweise haben wir diese 
Fragen im vorliegenden Kapitel behandelt. Dabei beschränkten wir uns freilich 
auf einige Beispiele verschiedener Struktur. Diese beiden Fragen haben oft die Aul- 
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merksamkeit der Forscher von der wichtigen Aufgabe einer Fehlerabschätzung 
für die erhaltenen Resultate abgelenkt. Dieser Fehler setzt sich zusammen aus dem 
Modellfehler und dem statistischen Fehler bei der Modellierung. 

Um den statistischen Fehler herauszubekommen, muß man die statistische Re- 
produzierbarkeit der Resultate mit dernotwendigen Genauigkeit erreichen. Für seien 
Abschätzung ist es besonders wichtig zu wissen, mit welchem Typ von zufälligen 
Größen wir es zu tun haben. Die Aufgaben des Typs A, B, C und D, die im ersten 
Kapitel formuliert wurden, erfordern ein unterschiedliches Herangehen an die 
Fehlerabschätzung, obgleich man sich oft einfach damit begnügt, bei der Wieder- 
gabe der Modelle eine Reihe approximativer Resultate zu erhalten. 


Die Abschätzung des Modellfehlers (wenn vom Fehler der Modellierung abgesehen 
wird) erfordert genau genommen den Vergleich mit dem Experiment. Es kann 
vorkommen, daß solche Experimente früher nicht durchgeführt wurden oder nicht 
durchführbar sind, weil sie zu kompliziert und zu kostspielig sind, obwohl es natür- 
lich experimentelle Daten gibt, die für die näherungsweise Beschreibung der ele- 
mentaren Verteilungen benötigt wurden. Da der resultierende Fehler sich aus den 
Fehlern der einzelnen Verteilungen zusammensetzt, sollte man in diesen Fällen 
wenigstens experimentell die Stabilität des Modells in bezug auf die Fehler der 
Verteilungen überprüfen. Diese Prüfung wird gewöhnlich mit der Monte-Carlo- 
Methode realisiert, d. h., die einzelnen Verteilungen oder ihre Parameter werden 
mit gewissen zufälligen Fehlern versehen, worauf dann die Modellierung durch- 
geführt wird. Die Frage nach der Verteilung der Fehler wird oft intuitiv gelöst 
und seltener auf der Grundlage einer Analyse der experimentellen Daten. 

Nicht selten sind die Daten des Experiments zu unvollständig, um auf ihrer 
Grundlage begründete Aussagen über den Charakter einer der elementaren Ver- 
teilungen machen zu können. Wenn aber die Daten, die man als Ergebnis der 
Modellierung erhalten will, nur wenig von den Fehlern dieser Verteilung abhängen, 
dann kann die Aufgabe dennoch erfolgreich gelöst werden. Bei der Analyse des 
Beitrags der Fehler der elementaren Verteilungen zum Gesamtfehler des Modells 
kann mit Erfolg der Apparat der Varianzanalyse angewendet werden, der oft in 
der Statistik bei der Aufbereitung experimenteller Daten benutzt wird (ScHEFFE[1]). 


Wie wir schon bemerkt haben, erfordert schließlich die Schätzung von Wahr- 
scheinlichkeiten seltener Ereignisse spezielle Methoden. Die geringe Ordnung der 
Fehlerabnahme bei der Monte-Carlo-Methode gestattet es nicht, eine kleine 
Wahrscheinlichkeit mit einem annehmbaren relativen Fehler zu schätzen (bei 
vernünftigem Arbeitszeitaufwand des Rechenautomaten). In solchen Fällen muß 
ein gewisses fiktives Modell benutzt werden. Ein einfaches Beispiel dafür wurde 
im Zusammenhang mit den Aufgaben des Strahlendurchgangs in $ 1 besprochen. 
Nicht für jede reale Aufgabe kann man so leicht ein fiktives Modell mit den nötigen 
Eigenschaften angeben (und auch begründen). Da bei der Benutzung eines belie- 
bigen Modells die Berechnung der verschiedenen Mittelwerte dem Wesen nach eine 
Schätzung von Erwartungswerten ist, d.h. von Lebesgueschen Integralen über 
gewissen o-endlichen Maßen, können als Quelle fiktiver Modelle gewisse spezielle 
Integrationsmethoden dienen. Verfahren der Dispersionsverkleinerung, die in 
den folgenden Kapiteln besprochen werden, haben eine unmittelbare Beziehung 
zu diesen Fragen. 


IV. METHODEN ZUR NÄHERUNGSWEISEN 
INTEGRALBERECHNUNG 


$1. Quadraturformeln in Funktionenklassen und die Monte-Carlo-Methode 


Wie schon im ersten Kapitel bemerkt wurde, ist die Monte-Carlo-Methode in erster 
Linie eine Methode zur näherungsweisen Integration. Wenn wir den Erwartungs- 
wert irgendeiner Zufallsgröße schätzen, die auf einem Wahrscheinlichkeitsraum 
(X, U, «) definiert ist, dann schätzen wir das Lebesgue-Stieltjes-Integral 


I=/S fx) ulde) . (4.1.1) 


Soll die Monte-Carlo-Methode im engeren Sinn (Aufgabe A) angewendet werden, 
so muß dabei f(x) mindestens quadratisch integrierbar sein: 


S Pix) u(de) <o. 


In diesem Kapitel werden hauptsächlich solche Methoden untersucht, die ent- 
weder keinerlei Einschränkungen außer der Konstruktivität bezüglich des Maßes u 
erfordern oder die sich auf den Fall beziehen, daß für das Lebesguesche Maß eine 
Wahrscheinlichkeitsdichte p(#) existiert. Dabei wird stets die Aufgabe A be- 
trachtet, also die Monte-Carlo-Methode im engeren Sinn, was nicht in jedem 
konkreten Fall speziell gesagt wird. Die Variable & wird immer als Vektorgröße 
x = (X, ...,%) aufgefaßt. Theoretisch könnte der Raum X als unendlichdimen- 
sional angenommen werden (die Endlichkeit von s wird, falls nötig, besonders 
erwähnt), aber für die Konstruktion numerischer Verfahren im unendlichdimen- 
sionalen Fall sind zusätzliche Untersuchungen und Voraussetzungen notwendig 
(TscHexzow [1], Sogor [3]). 

Wenn die Dichte p(&) existiert, s endlich ist und f(&) einer genügend engen 
Funktionenklasse angehört (z. B. genügend oft differenzierbar nach allen Variablen 
ist), kann für die Berechnung des Integrals / der klassische Apparat der Quadratur- 
formeln (bzw. Kubaturformeln) angewendet werden. Für das weitere ist es not- 
wendig, kurz auf einige Fakten und Definitionen aus der Theorie der näherungs- 
weisen Quadratur einzugehen. Dabei verfolgen wir aber keineswegs das Ziel, 
einen irgendwie vollständigen Überblick über die verschiedenen tiefgehenden 
Untersuchungen zu diesen Problemen zu geben. 

Es sei p(®) = 0 in einem gewissen Gebiet D des s-dimensionalen euklidischen 
Raumes, o,(&) einein D definierte Funktion und /(®) € F aus einer gewissen Klasse F 
von in D definierten Funktionen, für die das Integral 


J = Yıl®) pl) Fa) de 


a 
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existiert und endlich ist. Gewöhnlich nennt man 
f Yı(®) Pla) fa) dae =2 Arftaı) (4.1.2) 


eine Quadraturformel (im mehrdimensionalen Fall oft Kubaturformel) mit dem 
Gewicht p(&). Die Zahlen A,;, die nicht von der Funktion f abhängen, heißen 
Koeffizienten (Gewichte) der Quadraturformel, die &; Knoten (Stützstellen). 
Häufig wird angenommen, daß alle x;€ D sind, was auch im weiteren vorausgesetzt 
wird. 

Wir werden die Summe 


Kulfl = z Aufl) (4.1.3) 


Näherungssumme nennen und die Größe 


n 


Kulfl ; Fıl®) fe) pie) de 2 A:fe.) (4.1.4) 


Restglied der Quadraturformel. Ist für ein f = f, der Rest R,[f,] = 0, so sagt man, 
daß die Quadraturformel (4.1.2) für f = /, exakt gilt. Es ist leicht zu sehen, daß 
zu jeder konkreten Funktion f(x) eine Quadraturformel mit nur einer Stützstelle 
konstruiert werden kann, so daß R,[f] = 0 ist. Das setzt allerdings voraus, daß 
die Größe des Integrals J a priori bekannt ist, und kann daher nicht Gegenstand 
einer inhaltsreichen Theorie sein. Gewöhnlich wird die Aufgabe der Auswahl der 
Stützstellen und Koeffizienten (aller oder einiger davon) so gestellt, daß der Rest 
R,[f| für alle Funktionen f aus F genügend klein wird. Eine wichtige Rolle spielt 
der Begriff der Konvergenz einer Folge von Quadraturformeln. Wir betrachten 
dazu eine Folge von Näherungssummen 


Kylfl -2 ADDEN). 


Man sagt, daß die Folge der entsprechenden Quadraturformeln für Funktionen der 
Klasse F konvergiert, wenn 


lim Kulfl = Saı®) Ion) Die) dar 


ist. Dabei kann es für jedes n andere Stützstellen x” und Koeffizienten A) 
geben. 


Im weiteren werden wir drei Methoden betrachten, eine Quadraturformel zu 
konstruieren. 


1. Es ist ein System von in D definierten und dort linear unabhängigen Funk- 
tionen {9}, ?= 1, ...,n, gegeben (die in (4.1.2) aufgetretene Funktion g, gehört 
dazu), so daß die Integrale 


f Pla) Pilae) p(e) dar , i=1l..,n, 
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bekannt sind. Dann kann man ohne Beschränkung der Allgemeinheit annehmen, | 
daß 9,(#%) normiert ist, also | 


Je) pe) de = 1 | 


ist und die 9,(8), = 2, ...,n, zu p,(a) orthogonal mit dem Gewicht p(&) sind, | 
also 
Fi Yıl®) Pla) ple) de = 0 


gilt. Diese Voraussetzung über die p,(&) soll weiterhin immer erfüllt sein. 
Wir wählen jetzt n Stützstellen #,€ 2,7 = 1, ..., n, und führen die Bestimmung 
der Koeffizienten A, so durch, daß die Quadraturformel exakt für jede Funktion 
9:(&) gilt. Wurden solche A; gefunden, so wird die Formel (4.1.2) wegen der Lineari- 
tät der Aufgabe auch für jede Linearkombination der g,(#) exakt gelten. Schreiben 
wir die Bedingungen hin, daß (4.1.2) für die p;(@) exakt gelten soll, so ergibt sich 
zur Bestimmung der 4, ein lineares algebraisches Gleichungssystem 


n 1 fü jel, 
Ze) = h für j=2,..,n. (4.1.6) 


Dieses System ist lösbar, wenn für seine Determinante A (#,,...,%,) = det ||p;(&.)|| #0 
(© bezeichnet den Zeilenindex) gilt. Das bedeutet eine gewisse Einschränkung 
bezüglich der Lage der Stützstellen der Quadraturformel. Diese Einschränkungen 
sind aber sehr geringfügig. Bezeichnet nämlich 2,= Dx :-- x D das kartesische 
Produkt von n Exemplaren des Gebiets D mit sich selbst, so daß 


= (8: 2, En) E Da 


ist, dann ist leicht zu zeigen, daß das Lebesguesche Maß der Menge {Q : A(Q) # 0} 
positiv ist. Das folgt daraus, daß die Gramsche Determinante 


det 


Fre) pa) Pi) da 


eines Systems orthonormierter Funktionen gleich Eins ist, und aus dem Lemma 4.1, 
das im nächsten Paragraphen bewiesen wird. 

Für die entsprechende Näherungssumme kann man mit der Cramerschen Regel 
leicht einen expliziten Ausdruck herleiten: 


Kun= 48, (4.1.6) 


4Q 


Dabei ist A(f, @) = det ||f(®;), P2(#;); ++ 9rnl;)|i und JQ = A(9,, Q). 

Gewöhnlich nennt man Formeln der Art (4.1.6) Interpolationsquadraturformeln. 
Wenn wir erreichen wollen, daß eine Interpolationsquadraturformel für ein Funk- 
tionensystem {9}, = 1,..., N mit N >n, exakt gilt, so sind starke Forderungen 
an die Lage der Stützstellen x, zu stellen. Jetzt folgt aus (4.1.5) unter der Voraus- 
setzung der Orthogonalität der p,(&), j = 2, ..-, N, zu g,(&), daß die Beziehung 


det ||pr(&3), Pal), +, Pal) = 0 (4.1.7) 
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für a<r<N gelten muß. Diese Beziehung stellt ein System nichtlinearer 
Gleichungen dar, denen die Koordinaten der Punkte &, genügen müssen. Am voll- 
ständigsten ist die Theorie solcher Systeme für den Fall entwickelt, daß die @.(&) 
Polynome sind (Quadraturformeln vom Gaußschen Typ). Der allgemeine Fall eines 
beliebigen Systems von Funktionen ;(%), die in einem beliebigen Gebiet D ortho- 
normiert sind, ist bisher wenig untersucht worden. Jeder konkrete Fall erfordert 
spezielle Untersuchungen, die besonders im mehrdimensionalen Fall recht kompli- 
ziert sind. Im allgemeinen Fall ist es auch schwer, irgendwelche genügend ein- 
fache Empfehlungen für die Wahl der Stützstellen einer Interpolationsquadratur- 
formel zu geben, die einen kleinen Fehler für die Funktionen einer Klasse sichern. 
Das Restglied einer Interpolationsquadraturformel wird häufig durch die Ablei- 
tungen des Integranden ausgedrückt (wenn diese existieren). Die entsprechenden 
Formeln findet man beispielsweise in dem Handbuch von W. I. Kryzow [1]. 

2. Eine zweite Art der Behandlung ist mit der Konstruktion optimaler Quadra- 
turformeln in Klassen differenzierbarer Funktionen verbunden. Am einfachsten 
läßt sich diese Methode an einem konkreten Beispiel illustrieren. Die Funktion 
f(x) einer Veränderlichen soll auf dem Intervall [a, b] eine Ableitung haben, die 
einem gewissen Banachraum B angehört. Dann kann /(x) auf [a, b] in der Form 


fix) = f(a) + Saft) 


dargestellt werden. Soll die Formel (4.1.2) für eine Konstante exakt sein, so ist 
ihr Restglied 
Fi 


b x 
” dit n 
Ralf) = f | MO a4 N ar) 


für (x) = 1, p(®) = 1/{b — a) ein Element des zu B adjungierten Raumes der 
Funktionale, und es läßt sich dessen Norm berechnen. Ist also f’(t) eine stetige 
Funktion, so gilt 


[R.[fI < max |f‘(a)) 1 kr - EA du) dt (4.1.8) 
azızb b—-a 
b 


mit 
1 für t>e, 
A—a)=ıll2 für i=z, (4.1.9) 
0 für t<x, 
und das Gleichheitszeichen wird für ein bestimmtes f mit stetiger erster Ableitung / 
angenommen. Wählt man die A, und x; so, daß die Größe 
b 


Part n | 
fi Fin 
i=1 


ba 


u 


minimal wird, dann ergibt sich eine Quadraturformel, die man üblicherweise die 
beste in der Klasse der einmal stetig differenzierbaren Funktionen nennt. Man 
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könnte auch sagen, daß sie die beste für die „schlechtesten“ Funktionen dieser 
Klasse ist. Ein analoges Vorgehen ist auch für andere Klassen differenzierbarer 
Funktionen möglich. 

In allen Fällen ergibt sich die Aufgabe, das Minimum einer komplizierten Funk- 
tion mehrerer Veränderlicher zu finden. Für gewisse einfachste Funktionenklassen 
bei einer Veränderlichen kann eine solche Aufgabe vollständig gelöst werden. 
Besonders schwierig ist das Problem, eine optimale Quadraturformel in Funk- 
tionenklassen bei mehreren Veränderlichen zu bestimmen. Wesentliche Beiträge 
dazu enthalten die Arbeiten von 8. L. SoBoLEW [2]. Für Funktionen mit geringen 
Differenzierbarkeitseigenschaften erhielt I. M. Sogor [2] einige Resultate, aber 
eine ausführliche Darstellung dieser Ergebnisse würde den Rahmen dieses Buches 
sprengen. 

3. Die dritte Methode ist mit dem Studium des asymptotischen Verhaltens des 
Bestgliedes R,[/] der Quadraturformel verknüpft, wenn n gegen Unendlich strebt. 
Man versucht, für eine gegebene Funktionenklasse solche Formeln zu konstruieren, 
für die die Abnahme des Fehlers nahezu optimal schnell erfolgt. Dieses Vorgehen 
hängt mit der vorhergehenden Methode eng zusammen und seine Hervorhebung 
ist in gewisser Weise willkürlich. 

Gut bekannt ist das folgende Resultat (SoBoL£w [2]). Ist feine auf dem Intervall 
[0, 1] (andere Intervalle werden durch eine lineare Transformation auf [0,1] 
zurückgeführt) definierte m-mal differenzierbare Funktion einer Veränderlichen, 
so gibt es eine solche Folge von Quadraturformeln, für deren Restglieder R,„ die 
Abschätzung 


IRıl/]l S AnMun”” (4.1.10) 
gilt. Dabei ist n die Anzahl der Stützstellen, M„ = sup |/”(z)]| und A, eine 


0sr=sl 
Konstante, die nur von den Eigenschaften der Funktion f abhängt. 


Ist /(@) im s-dimensionalen Einheitswürfel 2, (oder in einem rechtwinkligen 
Parallelepiped) definiert, so kann das Integral f fix) de als iteriertes Integral 


dargestellt werden, und für seine Berechnung Können eindimensionale Quadratur- 
formeln bezüglich jeder Veränderlichen benutzt werden. Besitzt daher die Funk- 
tion fin D, alle möglichen partiellen Ableitungen m-ter Ordnung und ist % die 
Anzahl der Stützstellen in der mehrfachen Quadraturformel, so kann eine solche 
Folge von Formeln gefunden werden, für deren Restglieder R,„ die Abschätzung 


Ralf] < Am, Mmn® (4.1.11) 


|_ 8" f(@) 
Mn = sup ———— 
Hm = Oalı ne Oxs 


mit 


B mtr trmem, 


gilt. A.,s ist eine Konstante, die von s und den Eigenschaften der Funktion f 
abhängt. Dabei kann man solche Funktionen f angeben, für die (4.1.10) bzw. 
(4.1.11) mit dem Gleichheitszeichen erfüllt sind. 

Die Benutzung iterierter Quadraturformeln führt daher mit wachsendem s zu 
einer starken Verlangsamung der Fehlerabnahme. Im Jahre 1957 zeigte N.S. 
BacHhwaLow, daß dieses Resultat mit keiner Integrationsmethode verbessert 


7 EBrmakow, Monte-Carlo-Methode 
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werden kann, wenn man nur Informationen über die Zugehörigkeit der Funktion 
zu einer bestimmten Klasse oder Informationen über Werte der Funktion f und 
ihrer Ableitungen in einzelnen Punkten benutzt. Genauer wurde von ihm gezeigt: 
Es sei H(m, a,/) die Funktionenklasse, für welche die partiellen Ableitungen bis 
zur m-ten Ordnung einschließlich dem Betrag nach durch die Konstante a be- 
schränkt und die Ableitungen m-ter Ordnung mit dem Exponenten} O<A<s<I]) 
hölderstetig sind, also 


0” f(ae’) 9” f(ae’’) N er: 
= = —_ |. .l. 
oa ae Aa. Sal az Iaa — el wi. 


Ist dann fe H(m, a, A), so gilt für eine beliebige Integrationsmethode 
sup [Elf] 2 A a,m4n th (4.1.13) 
cH 


Die Abnahme der Konvergenzordnung mit wachsender Dimensionszahl ist daher 
durch die umfangreicheren Funktionenklassen erklärbar und nicht durch Unzu- 
länglichkeiten bei der Aufstellung der Quadraturformel bedingt. Es ist natürlich, 
daß bei der Berechnung von Integralen abzählbarer Vielfachheit (konkrete Auf- 
gaben, bei denen Berechnungen solcher Art erforderlich sind, werden in den 
nächsten Kapiteln betrachtet) Abschätzungen, die nur Differenzierbarkeitseigen- 
schaften des Integranden ausnutzen, zu schlechten Resultaten führen. TscHEnzow 
[1] zeigt in einer Arbeit, daß es für eine beliebige Quadraturformel der Art (4.1.2) 
unter den analytischen periodischen Funktionen der Gestalt sin? («; — x;) eine 
solche gibt, für die der Wert der Näherungssumme den Integralwert mit einem 
Fehler von mehr als 50% wiedergibt. 

Zur Gewinnung von Quadraturformeln mit besseren Eigenschaften ist es daher 
notwendig, engere Funktionenklassen auszusondern, die durch andere Eigenschaf- 
ten als Glattheit oder sogar Analytizität zu charakterisieren sind. Ein solcher 
Weg wurde in den Arbeiten von N. M. KoroBow und später von N. S. BACHwALoWw 
beschritten. 

Eines der Resultate von N. M. Korogow soll hier dargestellt werden. 


Es sei 2, der Einheitswürfel O<x;,<1,i=1,....,s, und f(x) eine in D, defi- 
nierte und bezüglich jeder Variablen x; periodische Funktion. Wir werden anneh- 
men, daß /(z) fast überall in 2, durch seine Fourierreihe darstellbar ist: 


fa) 5 c(m) exp (2ri(m, &)). 
ET 

cm) = cm, ...,M,) = S fx) exp (2ri(m, x)) de 
mit m 

(m, &) -2 mi. 


Weil 
S fx) de = c(0, ..., 0) 
De 
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ist, kann das Restglied der Quadraturformel 
Rn 
Sta) de zn! Y fr) (4.1.14) 
Ds k=1 


in der Form 
Rulf] = X em) n7! > exp (— 2ri(m, &,)) (4.1.15) 
k1 


My, Mn — Rn 


geschrieben werden. Dabei bedeutet der Strich beim Summenzeichen das Fehlen 
des Summanden für m = --=m,=0. Man kann hoffen, daß das Restglied 
R.[f] gemeinsam mit der trigonometrischen Summe 


S(m) = nt 3 exp (2ri(m, #)) (4.1.16) 
k=1 

klein wird. Es sei f(x) € E£ aus der Klasse der in jeder Veränderlichen x; period- 
ischen Funktionen, für die die Abschätzung 

cm) — O((imm, -- m) =”) 
erfüllt ist. y ist eine reelle Zahl größer als Eins, die asymptotische Abschätzung 
gilt gleichmäßig für die m,, und es ist 

2 1 für m=0, 


m — = L.58: 
mil sonst 


Wir wählen einen Punkt a; = (z{P, ..., 2®) und setzen 


a (a 
7 n.|’ 


wobei {a} den gebrochenen Teil der Zahl a bedeutet. Die ganzen, zu n teilerfremden 
Zahlen a,, @,, ..., a, werden wir optimale Koeffizienten nennen, wenn Konstanten 
B = ß(s) und c, = c,(s) derart existieren, daß für irgendeine Folge von n-Werten 
die Ungleichung 


n—1 ; 2% 8 
5 Önlaımı + Am; + Fam) _ ä = n (4.1.17) 


Men iM —(n—1) MN, Ms 


mit 


Önlm) = 


| l, wenn » Teiler von m, 


0, wenn n kein Teiler von m, 
erfüllt ist. Die Zahl $ heißt Index der optimalen Koeffizienten. Dann gilt der 


Satz (Korogow [2]). Es sei n>2, a,,...,a, seien optimale Koeffizienten, 
a; = a,(n), und 8 der zugehörige Index. Dann gilt für den Fehler der Quadratur- 
formel 


Shaw oa) day dt (Ro (er) + Rn 118) 
0 0 "N k=1 


N N 


7* 
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die Abschätzung 
Ik. S On” log n (4.1.19) 


mit einer nur von y und s abhängigen Konstanten ©. 
Wir bemerken, daß man mit der Summe der geometrischen Reihe leicht die 
Gleichung 


n A 
lat Fo (amt =") (4.1.20) 
N Ye N 
erhält. Aus (4.1.15), (4.1.17) und (4.1.20) folgt dann 
Rlfl= 53 cm)önam)<e X önla,m) (My-- m), 
My, = — 00 My Nm — oO 


wobei @ = (@,, ...,4,) ist. Die Optimalität der Koeffizienten a,, ..., a, besteht 
darin, daß ö„(a, m) für eine genügend große Anzahl von Werten m,, ..., m, ver- 
schwindet. Dann wird der Hauptteil des Restgliedes mit Hilfe der Ungleichung 
(4.1.17) abgeschätzt, und der Einfluß der übrigen Summanden ist im Verhältnis 
zum Hauptteil klein. 

Eine ausführlichere Darstellung der Fakten, die mit den optimalen Koeffizienten 
zusammenhängen, kann man in der Monographie von KoRoBow [2] finden. Dort 
gibt es insbesondere auch eine Tabelle der optimalen Koeffizienten. Für die Klasse 
E$ liegt die Abschätzung (4.1.19) nahe bei einer unteren Abschätzung des Integra- 
tionsfehlers. BacHwaLow bewies, daß für diese Klasse 


Kl S On’ 
gilt, wobei €, nicht von » abhängt (vgl. auch ScHharvem [1)). 


4. Die Monte-Carlo-Methode schätzt in ihrer einfachsten Form den Wert des 
Integrals f /(&) v(d&) mit Hilfe des arithmetischen Mittels 


1 N 
N Pi fa); (4.1.21) 


wobei die #; unabhängig sind und ihre Verteilung durch das Maß u bestimmt wird. 
Formal besitzt diese Formel eine Ähnlichkeit mit den oben beschriebenen Methoden 
der Integralberechnung. Dem Wesen nach unterscheidet sich die Monte-Carlo- 
Methode allerdings davon, weil sie auf einem wahrscheinlichkeitstheoretischen 
Zugang beruht und ihre Konvergenz der Wahrscheinlichkeit nach erfolgt. Infolge- 
dessen gelten folgende Aussagen. 
a) Das Restglied 
N 


1 
S Ka) ld) — 21) 


nimmt unabhängig von der Dimension s des Raumes X ab. Wie schon im ersten 
Kapitel bemerkt, wird das Restglied für eine feste Funktion f aus L,(#) und bei 
festem Konfidenzniveau y von der Ordnung N-!2 klein. Übrigens gilt dieselbe 
Ordnung des Restgliedes auch für eine beliebige Funktion f aus einer Funktionen- 


2 
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klasse F mit Fc L,(z). Der Charakter einer Klasse F mit Fc L,(u#) kann sich nur 
darauf auswirken, wie schnell die Verteilung des arithmetischen Mittels (4.1.21) 
gegen die Normalverteilung konvergiert. Ist dagegen L,(#)c F, so nimmt das 
Restglied langsamer als N -"/?ab, und die Grenzverteilung des arithmetischen Mittels 
ist von der Normalverteilung verschieden. 


b) Die Schätzung des Integrals erfolgt sukzessiv. Bei Vergrößerung von N 
werden in natürlicher Weise die vorher berechneten Funktionswerte mit verwendet. 
Die deterministischen Quadraturformeln besitzen bei weitem nicht immer diese 
Eigenschaft. 


c) Parallel zur Integralberechnung kann in einfacher Weise der Verfahrensfehler 
geschätzt werden. Konvergiert also die Verteilung des arithmetischen Mittels 
mit der Ordnung O(N-U2) gegen die Normalverteilung, dann kann durch Be- 
rechnung des arithmetischen Mittels der Quadrate der Funktionswerte in den 
Punkten x; die Dispersion von (4.1.21) geschätzt und ein Konfidenzintervall zum 
gegebenen Konfidenzniveau konstruiert werden. Praktisch erscheint die Fehler- 
abschätzung für deterministische Quadraturformeln in der Mehrzahl der Fälle 
als eine hoffnungslos schwierige Aufgabe, wenn f genügend kompliziert ist, denn 
man muß das Supremum der Ableitungen abschätzen. Schon die Definition einer 
Klasse differenzierbarer Funktionen, in der f liegt, ist keineswegs einfach. Die 
Benutzung der Monte-Carlo-Methode fordert freilich auch Kenntnisse über die 
Zugehörigkeit von f zu einer bestimmten Funktionenklasse. Es ist wünschenswert, 
daß das Integral f |f?(®)| zu(da) einen endlichen Wert hat, damit die asymptotische 
Normalverteilung von (4.1.21) und eine für praktische Zwecke genügend genaue 
Schätzung der Dispersion gesichert ist. Die Forderung nach der Endlichkeit des 
dritten Momentes ist allerdings weniger einschränkend als die Beschränktheit der 
Ableitungen und kann während der Rechnung kontrolliert werden. 


Im weiteren werden wir hauptsächlich den Fall F < L,(w) betrachten. Der Fall 
F=L,(w), 1<p=2, wurde bisher wesentlich weniger untersucht. Er wird 
beispielsweise in den Arbeiten von KAros [1], Törx [1] und BachwALow [3] be- 
trachtet (siehe auch Ungleichung (1.3.14) in Kap. I). 


Wie schon bemerkt, bleibt bei Benutzung des arithmetischen Mittels (4.1.21) 
für die Schätzung des Integrals auch im Fall einer engen Funktionenklasse F, 
FcL,(#), die Ordnung des Fehlers bei N-"/2. Man kann sich aber auf einen anderen 
Standpunkt stellen und den Fall betrachten, daß es eine gewisse Menge von 
deterministischen Quadraturformeln gibt, die für die Integration von Funktionen 
aus F geeignet sind, und eine konkrete Formel zufällig aus dieser Menge ausgewählt 
wird. Dieser Weg wurde von N. 8. BACHWALOW in einigen Arbeiten vorgeschlagen, 
von denen wir auf die Arbeiten [1], [2] und [3] hinweisen, aber dann untersuchten 
auch andere Autoren dieses Problem. Die Bildung eines Zufallsmodells solcher Art 
bietet bestimmte Vorteile, die mit einer Vergrößerung der Konvergenzgeschwindig- 
keit des Quadraturverfahrens zusammenhängen. Als Beispiel wird die Schätzung 
des Erwartungswertes des Restgliedes der einfachsten Quadraturformel angeführt: 


i 1: „#.,0% 
[1a) de =, 21(5)+ Ralf). (4.1.22) 


0 N kl 
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Bezüglich der Funktion f(x) nehmen wir an, daß ihre Fourierkoeffizienten c(m) 
(re) w 3 c(m) exp Gnime)) der Ungleichung 
m=—x 
oo 
3 lem)? m < ce? < 
genügen. Die so definierte Funktionenklasse bezeichnen wir mit F,(c). Die 


Näherungssumme K,„[f], die der Formel (4.1.22) entspricht, besitzt die leicht 
nachzuweisende Eigenschaft 


z : a 
K,fezrimz) — 1 5 ertmfa — $,(m) = h ‚ falls n kein Teiler von m, 
N 1 1, falls » Teiler von m. 


Daraus folgt 
oo oo 
Ralfl= &Temn) + em = Lem 

j- u 

mit cn; = e(nj) + e(— nj). 
Es ist leicht zu sehen, daß ne Y2 cos (ren) € F,(c) ist und folglich 
sup |Rulfll 2 ne y2 (4.1.23) 
) 


TeFy(e 
gilt. Nun seien n und N ganze positive Zahlen mit N +1<n=2N undy >|. 
Dann kann R,„[f] in der Form 
oo x 
Kl = n”2 [enjtaj)” 5°] = 2 [entns)” 57"? - °P] 
a zn 


dargestellt werden. Die Ungleichung von Schwarz-BUNJAKOWSKT liefert dann 
folgende Abschätzung für |R,[/]?: 


oo oo 
Ru? < n®r 3 Tomte. 
i= = 
oo 
Die Summe J 5172’ ist der Wert der £-Funktion im Punkt 1 — 2y, also gilt 
je 
RAM Ssn il — v2 lon;l? (mi)? 5”. (4.1.24) 
ji= 


Wir nehmen an, daß n die Werte von N + 1 bis 2N mit der gleichen Wahrschein- 
lichkeit p = 1/N annimmt, und schätzen den Erwartungswert des Betrages des 
Restgliedquadrates ab: 


2 


Y 
MIkÜAl = N all? . 
+1 


n=N 


Aus (4.1.24) folgt die Ungleichung 


2N 2N 00 
va SER UNI S 3 ten? mi} 


n=N n=N+lj=l 
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Wir setzen nj = k. Dann gilt 
oo a oo k -1 
LE lonjl? (ni) = 5” Jon? 287 () 
j=1 kn N 


wobei die beiden Striche am Summenzeichen bedeuten, daß nur die Summanden 
vorkommen, für die k ein Vielfaches von r ist. Das ergibt die Abschätzung 


I oo . \-1 

E 5” jox Br () < 5 Il? k’r (o8) tik; N+1,2N), 
n=N-+liken k=N+1 2N 

wobei r(k; N + 1,2 N) die Anzahl der Teiler von k unter den Zahlen von N +1 

bis 2N bedeutet. Bezeichnet (rn, m) den größten gemeinsamen Teiler von » und m, 

so sind offensichtlich die Aussagen (n, m) = m und (n, n/m) = n/m einander 

äquivalent. Dann ergibt sich 


k k k 
: ON — Be. R 
t(k; N + 1,2N) (bamey + )s|y TH 35] + 1 =, 
kN. 
Daraus folgt 
N-ı — PR 2 2 N 2 k2r "(3% 
va ne Sey nn Sole) (ii) 
< 6&2y — 1) N (4.1.25) 
wegen 
& laltkrs2 3 lek)l? Ik. 
k=N-+1 k=—o 
Es ist also 
MIR? Ss N rt 60(2y — 1). (4.1.26) 
d.h., die Dispersion des Restgliedbetrages hat die Größenordnung O(N-®-1), 
während für das Supremum des Betrages die Ungleichung (4.1.23) gilt. Man 
kann auch Resultate herleiten, die sich auf dieVerteilung der Größe | R,[f]| beziehen. 
Wir wählen dazu ein festes e > 0. Ist für r Werte der Zahl » die Ungleichung 
"| R,[f]| > e erfüllt, so gilt 


ER) 
rNAe<Nt N nnlRulf]®. 
a=N+1 
Für r > &?6£(2y — 1)c? widerspricht das aber (4.1.26). Bei gleichwahrschein- 
licher Wahl vonn au N +1<sn<2N undfürNg=r,g9<1l, ist mit der Wahr- 
scheinlichkeit 1—g=1-— r/N die Ungleichung 


IRalf]| S eg" ?f122(2y — DR nr? 


erfüllt. Das ist eines der einfachsten Resultate, die sich auf die zufällige Auswahl 
einer Quadraturformel aus einer gewissen Menge von Quadraturformeln beziehen. 
Eine Reihe anderer Ergebnisse kann man in den Arbeiten von BacHwALow [2], [3] 
und ScHARYGIN [1] finden. 
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Eine Abschätzung nach unten für den Erwartungswert des Restgliedes einer 
Quadraturformel in der Funktionenklasse H({m,a,}) und in einigen anderen 
Funktionenklassen erhielt BachwALow [1]. Insbesondere gilt bei beliebiger Bil- 
dung eines Zufallsmodells die Ungleichung 


sup MIR„[f]l 2 caN "wink 2, 
IcH(m,a,i) 

Durch Bildung eines Zufallsmodells für die Quadraturformeln von N. M. KoRoBow 
ver (4.1.14)) mit Methoden, die den oben beschriebenen entsprechen, erhält man 
chätzungen für den Erwartungswert, die nahe bei den optimal möglichen liegen. 
Wie wir sahen, setzt ein solches Vorgehen nicht voraus, daß die entsprechende 
Näherungssumme eine erwartungstreue Schätzung des Integrals ist. Außerdem 
wird die Menge von Quadraturformeln, aus denen die zufällige Auswahl erfolgt, 

als gegeben vorausgesetzt. 


In diesem Buch werden in der Regel erwartungstreue Schätzungen des Integrals 
betrachtet, und die Funktionenklasse wird nicht explizit definiert. Daher haben 
wir uns auf die Darstellung des einfachsten Beispiels beschränkt, in dem die Anzahl 
der Stützstellen zufällig gewählt wird. Erwartungstreue Näherungssummen für 
Funktionen aus L,(z) werden ausführlich im nächsten Paragraphen betrachtet. 


Zum Schluß soll noch auf eine unmittelbare Beziehung zwischen statistischen 
Testen, die'auf eine endliche Zahlenfolge 2, 2, .„a, 0<m<l für alle ö, 
angewendet werden, und dem Fehler der einfachsten Quadraturformel 


1 1 N j 
SFa)dae = 2 I) (4.1.27) 
[1] i=1 


hingewiesen werden. Die Ergebnisse, die I. M. SogoL [4], [6] in dieser Richtung 
erhielt, erlauben es, die Rolle der statistischen Teste bei der Prüfung der Folge 
der Stützstellen in (4.1.27) auf Gleichverteilung genauer aufzuklären. Ist f(x) auf 
[0, 1] von beschränkter Variation, so gilt 


1 1 
N N 
froa-z &reo=--[|yZrm-n-ejam, «12 
i=1, i=1 
0 0 


wobei die Funktion ® durch (4.1.9) definiert wurde. (Vgl. auch (4.1.8), die Glei- 
chungen (4.1.28) bzw. (4.1.8) lassen sich durch partielle Integration herleiten). 
Aus (4.1.28) folgt 


| N 
RS sup 8 — N 800-2) varf. 
e[0,1] i=1 | 
N 

Die Funktion @x(&) = N! 3 9x; — x) ist die empirische Verteilungsfunktion 

i=1 
der Folge x,,%, ...,&y. Nimmt man an, daß die zugehörige theoretische Ver- 
teilungsfunktion auf [0, 1] eine Gleichverteilung bildet, so stellt der Ausdruck 


YN BD IR — Axle)] 


ze[0, 
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die Testgröße von KOLMOGOROFF für diese Folge dar. Ist also /(x) von beschränkter 
Variation, dann kann das Restglied bei der Integration unmittelbar durch die 
Kolmogoroffsche Testgröße ausgedrückt werden. Eine analoge Beziehung kann 
man auch zum v.-Mises-Smirnow-Test feststellen (SoBoL [4]), wenn /(x) eine quadra- 
tisch integrierbare Ableitung besitzt. Im mehrdimensionalen Fall kann man 
analoge Resultate erhalten, wenn man voraussetzt, daß f(x) von beschränkter 
Variation (im Sinne von VIraut) oder die gemischte Ableitung nach allen Veränder- 
lichen quadratisch integrierbar ist. Eine Darstellung dieser Ideen und Resultate, 
die die Beziehung zwischen dem Restglied der numerischen Integration und dem 
Kolmogoroffschen Test betreffen, sind in der Arbeit von BOBOL [6] enthalten. 
Wir werden diese Resultate in Kapitel VII erläutern. 


$2. Einige allgemeine Methoden zur Dispersionsverkleinerung 
Stochastische Interpolations-Quadraturiormeln. 


Durch Benutzung bestimmter Abbildungen der Zufallsgrößen, die den Erwartungs- 
wert fest lassen, aber die Dispersion ändern, kann man häufig Modifikationen der 
Monte-Carlo-Methode gewinnen, die effektiver als die ursprüngliche sind. Die 
Erhöhung der Effektivität ist in der Regel mit der Auswertung zusätzlicher Infor- 
mationen über den Integranden und das Maß, bezüglich dessen integriert wird, 
verbunden. Wir betrachten nun eine Reihe einfacher Modifikationen der Monte- 
Carlo-Methode, die bei der Integralberechnung Anwendung finden, und unter- 
suchen ihre Besonderheiten, 


1. Methode der Abtrennung des Hauptteils. Es soll das Integral J = f f(&) u(d) 
berechnet werden, und es gibt eine genügend nahe bei f(a) gelegene Funktion g(&#) 
derart, daß das Integral J, = f g(&) u(da) leicht analytisch oder mit Hilfe einer 
einfachen Quadraturformel auszurechnen ist. Dann ist 


J=Jı+S[f@) — g@e)] u(de) ; 
und es genügt, das Integral über die Differenz e(@) = f{®) — g(a) mit der Monte- 
N 


Carlo-Methode durch die Summe x’ = N! 5 [f(a@:) — g(&:)] abzuschätzen, wobei 
i=1 


die &; unabhängig und mit der Gesetzmäßigkeit u(d&) verteilt sind. Für die Dis- 
persion von x’ gilt dann 


Dr’ = N-1 {f !(@) ld) — [S e(®) u(de)]} . (4.2.1) 


Bedingungen, unter denen diese Methode vorteilhaft anzuwenden ist, kann man 
für jede konkrete Aufgabe einfach aufstellen. Zu diesem Zweck genügt es, die Dis- 
persion Dx’ analytisch oder experimentell auf Grund einer Stichprobe mittleren 
Umfangs zu schätzen. 
Wird als g(@) eine Linearkombination gewisser gegebener Funktionen gewählt, 
also 
N 


le DE 
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dann entsteht die Aufgabe, die Konstanten a; so zu bestimmen, daß die Disper- 
sion Dx’ ein Minimum erreicht. Die Lösung ist in diesem Fall wohl bekannt. 
Die Funktion g(&) muß ein Abschnitt der Fourierreihe von fnach dem Funktionen- 
system sein, das man aus den g, durch Orthogonalisierung erhält. Nimmt man 
an, daß die g; in L,(x) orthonormiert sind, so müssen die a; die Fourierkoeffizienten 
der Funktion f sein, also 


a; = S f®) pıl®) ade) . 


2. Methode der wesentlichen Stichprobe. Das Integral 
J = [ fa) n(de) 
soll durch die Summe x = N! Bi fac,) abgeschätzt werden, wobei die &; unab- 


hängige Zufallsgrößen mit der Wahtseheinliehkeiteverteilung u(dse) sind. In diesem 
Fall beträgt die Dispersion der Zufallsgröße x 


Dr = N! [fi@) — I] u(de) . 


Nun sei 2 ein beliebiges Wahrscheinlichkeitsmaß derart, daß u absolut stetig in 
bezug auf A ist. Dann nn 


cr f®) 7, az) , 


und es kann der Bee 


— 8 Eiw , 9) 


benutzt werden, ab die y; mit der Gesetzmäßigkeit A verteilt sind. Die Disper- 
sion beträgt jetzt 


Di, = N-! f Br Me 3| zn. (4.2.2) 


%r 


So erhalten wir eine Schar erwartungstreuer Schätzungen für das Integral J, die 
vom Maß A abhängen. 
Ist f(e) eine nichtnegative Funktion, so kann man ein A u so auswählen, 


daß x;, die Dispersion Null besitzt. Setzt man nämlich (x) = * (a), so kann 
man sich überzeugen, daß für . 


Ile) für fe) >, 
vr) -; für fie) = 0 


der Ausdruck (4.2.2) verschwindet. Das entspricht der Aussage 
1 
),(de) = T fx) u(de) . (4.2.3) 


Man muß also die Größe des Integrals vorher kennen, um die Schätzung mit ver- 
schwindender Dispersion konstruieren zu können. 
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‚ Ist u(de) = pl(®) de (es existiert also die Verteilungsdichte), so gilt A,(d) 
— J1f(x) p(a) da. Ist in diesem Fall },(#) mit einem Fehler bekannt, also 


gs Me) Dia) + ea)dr, lee) <Fe)ole). 


e=/[elt)de, e2)=0 für fa)pa)=0, 


dann gilt 


a) — Pia) 2°) _ 
Da, = (4) + af Tanz) Fa de — J?. 


Nun sei &, = sup al. Es ist leicht zu zeigen, daß Di, — Je für 9 —0 
= f®) p(®) i 

gilt. Dieses Resultat, das die Stabilität von Dx; in der Umgebung von A =, 

feststellt, kann in gewissen Fällen nützlich sein. 

Diese Methode der wesentlichen Stichprobe wird oft in den Fällen benutzt, in 
denen die Dispersion von x unendlich ist. Aus (4.2.3) folgt die Möglichkeit, ein 
solches A zu wählen, daß (4.2.2) einen endlichen Wert hat, falls nur das Integral 
J= S I\fa)l (da) endlich ist. Insbesondere kann man bei der Berechnung des 
Integrals / f{@) de (D ein Gebiet des euklidischen Raumes), wenn / /?(®) da nicht 

D D 


endlich ist, eine nichtnegative Funktion (x) derart wählen, daß /g(@) de = 1 
D 


ist und x, mit A(da) = p(®) de eine endliche Dispersion hat. Man kann beispiels- 


weise 
| fe) 
5: 


für fa)#0, 
P(®) | 


0 für fie) = 0 


setzen, woraus sich 


% 


Di, — 4 Ye) de | _ | Ste de| on 


ergibt. Ist f /?(&) d& nicht endlich, so wird gewöhnlich die Funktion-f{&) in zwei 
E) 


Faktoren f = gh so zerlegt, daß g keine Singularitäten hat und die Integration 
von h > 0 analytisch durchführbar ist. Sinnvollerweise wird als normierte Funk- 
tion h die Verteilungsdichte gewählt, nach der die Integration auszuführen ist. 
Das Verfahren wird Abspaltung der Singularität in der Dichte genannt. Eine Reihe 
von Anwendungen dazu kann man in dem Bucl# von Bustenko u.a. [1] finden. 
Manchmal wird folgende Aufgabe gestellt (Evans [1]). Es sollen » Integrale 
Jı=/f fı(@) u(da) berechnet werden. Wie oben wählt man eine gewisse Ver- 
teilungsdichte /(dy) und schätzt J; durch das arithmetische Mittel 


NS play 
u) — BZ F(y)) 12 (y;)- 
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Zu gegebenen reellen Konstanten ai =], ...,n, wird ein A derart gewählt, daß 
die Summe 


2 a? Dix — i (Zar) n) Ade) — Zar (4.2.4) 


ihr Minimum erreicht. Es genügt, das Minimum von 


s-[(£ cap) (GE) am 


zu suchen. Mit der Bezeichnung 
n 1/2 d 
(Zero) (G)w 
i=1 di 


ergibt sich DE = 8 — > O mit 


FT. - (Zen) man ‚also S> (er) eo)‘ (4.2.5) 


Das Gleichheitszeichen wird in (4.2.5) in Übereinstimmung mit (4.2.3) für 


BE ZEREEn 
(Zeine ) i 


i=1 


40 = 


angenommen. Also erreicht (4.2.4) sein Minimum bei 


= n 1/2 
Ada) = I-1 ( La ie) (dee) 
i=1 
und ist gleich 


ig n 
PR-ya. 


i=1 
Der letzte Ausdruck verschwindet, wenn die Summe P3 arfı(®) konstant ist. Insbe- 


sondere verschwindet der Ausdruck (4.2.4), wenn le fı(e) >0 und konstant 
sind. Diese Überlegungen erlauben es, a-priori-Informationen ae: die Integranden 
zu berücksichtigen und die Effektivität der Monte-Carlo-Methode zu erhöhen. 

Auf die beiden beschriebenen Methoden werden wir im weiteren in Verbindung 
mit konkreten Aufgaben zurückkommen. Offensichtlich kann man sie kombinie- 
ren, indem man etwa zuerst den Hauptteil des Integranden abtrennt und danach 
die Methode der wesentlichen Stichprobe anwendet. 


Als Beispiel für die Anwendung dieser Methoden führen wir das in der Arbeit 
von ROSENBERG [1] beschriebene Integrationsverfahren an, das auf der Anwen- 
dung der zum Integranden gehörigen Bernsteinpolynome beruht. 
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Es sei 
1 1 
J=f da, f da, fr 2%) = S Ix) de, 
0 o Ds 


wobei f(&) eine in 2, stetige Funktion ist. Bernsteinpolynom der Funktion f 
wird das Polynom 


Mı ms I 
B},....m(2) = Bi,(&) = a E lm sl I Pi,m(&) (4.2.6) 


mit m = (m,, ..., m,) und P;,m{&) = ig) «(1 — x)” =! genannt. Für m; ..., M;—>00 


l 
strebt Bi.(&,) gegen f(&,) in jedem Stetigkeitspunkt der Funktion f. Besitzt f 
im Punkt &, eine stetige partielle Ableitung der Ordnung k, so strebt die entspre- 
chende partielle Ableitung des Bernsteinpolynoms im Punkt x, ebenfalls gegen 
den Wert dieser Ableitung (NarTanson [1]). Auf diese Weise berücksichtigt B},(&) 
die Besonderheiten im Verlauf der Funktion f(&) genügend gut. 

Wir nehmen nun an, daß /(@) > 0 im Einheitswürfel 2, gilt, über den die Inte- 
gration durchgeführt wird. Weil das Hinzufügen einer Konstanten zu f(x) die 
Integrationsaufgabe nicht komplizierter macht, kann man annehmen, daß ini f&) 
>4A»>0gilt. Dann ergibt sich 


Bh)>AIT 5 Puma) =A>0, 
k=1l=0 


weil jede Summe eine Summe über die Wahrscheinlichkeiten der Binomialver- 
teilung darstellt und folglich gleich Eins ist. Wir bemerken auch, daß 


[ Ba) de = S = S 
Ds 


8 


II(m, +1) 
ke 


rl) 
ur = ı= mM, Toms 


gilt. Wir wenden uns nun der Methode der wesentlichen Auswahl zu und setzen 


Ada) = Bin(®) de 


mit 


mit 
Bin) - rl 
Ss 
Le ) (mr +1)! = 
=— ... — u, Hz, - es I mr Ik, 
Ss ER Ela Ms} xuı le! (mr — 1)! ® en) 
so daß sich 
N) Ha) de = 5 ae = Bin(x) dee (4.2.7) 
Ds Ds 


ergibt. 
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Eine angenehme Eigenschaft einer solchen Wahl von A besteht darin, daß sich 
die entsprechende Zufallsgröße verhältnismäßig einfach modellieren läßt. Die 


Dichte Bl,(®) ist mit folgendem stochastischem Modell verknüpft. Es seien 
sg 
M= II (m, — 1) Urnen gegeben, die durch die Indizes Z,, ..., 1, gekennzeichnet 


sind (l. = 0,..,Mmy; k=],...,s). Die Wahrscheinlichkeit, aus einer Urne mit 
den Indizes 1,, ..., 2, zu ziehen, sei gleich f(l,/m,, ..., Z,/m,)/S. Nach der Wahl einer 
Urne, d.h. von Werten der Indizes 1}, ..., !,, erzeugt man entsprechend der ge- 
wünschten Wahrscheinlichkeitsverteilung s unabhängige Zufallsgrößen 3, mit 
einer $-Verteilung, deren Parameter I; und m; — I, sind. Für I, = m; oder I, = 0 
erhält man ausgeartete $-Verteilungen, die den Dichten (m; + 1) x%* bzw. (m; + 1) 
x(1 — z;)"* entsprechen (vgl. (2.3.17)). Die Komponenten des Vektors (Y, +, Ys) 
besitzen die gemeinsame Verteilungsdichte B/„(x). 


Ein Bernsteinpolynom kann natürlich in der Methode der Abtrennung des 
Hauptteils auch als Funktion g(&) gewählt werden. Man kann auch bei der Schät- 
zung des Erwartungswertes der Differenz f(x) — B},(&) eine wesentliche Stichprobe 
mit der Dichte B}.(&) benutzen, was allerdings in der Regel keinen wesentlichen 
Vorteil bietet (die Differenz /(®) — B}„(&) kann im Verhalten andere Eigenschaften 
besitzen als f(&#)). 


Das beschriebene Integrationsverfahren ist dem Wesen nach ein Verfahren, das 


mit Hilfe der Monte-Carlo-Methode die einfachste Quadraturformel J = 8, die 
man als Ergebnis der wiederholten Anwendung der Rechteckformel erhält, genauer 
macht. Bei der Berechnung von mehrfachen Integralen hoher Dimension ist seine 
Anwendung mit Schwierigkeiten verbunden, die im allgemeinen bei der Benutzung 
äquidistanter Netze auftreten. Nichtsdestoweniger ist dieses Verfahren von prin- 
zipiellem Interesse, da es die klassischen Integrationsmethoden mit der Monte- 
Carlo-Methode verbinde. 


3. Erniedrigung der Integrationsordnung (BUSLENKO u.a. [1]). Die Veränder- 
lichen & = (&,, ...,2,) werden in zwei Gruppen eingeteilt: y = (x, .„„x%:) und 
== (41... %) << s, so daß sich 


J= Sf / Ky,) uldy de) 
() (=) 


ergibt. Wir nehmen an, daß man 
vay)= S nldyde) und jy)= S Mu.) Alde) 
analytisch berechnen kann, wobei i(dz) durch die Beziehung 
Aldz) Ä u(dy dz) = u(dy de) 
definiert ist. Dann ergibt sich 


J= S fy)r(dy). 
(9) 
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Bei der Abschätzung des letzten Integrals durch die Summe 


„= N 5 /y), 


wobei die %; mit der Gesetzmäßigkeit » verteilt sind, kann die Dispersion nur 


kleiner werden als bei der Abschätzung von J durch die Summe 


% 
»=N1 5 er). 
= 


In der Tat ist 
Ss P(y,2) u(dy de) J fy,=) a(dy dz) \)? 


DT add) | Frtude) 


uldyde)=0, 


weil der Ausdruck in den geschweiften Klammern die Dispersion der Zufallsgröße 
f(y,<) bei festem % darstellt. (Be Verteilung von z ist gleich u(dy dz)/ / u(dy 0e)-) 
(*) 


4. Geschichtete Stichprobe. Wir stellen den Raum X, über den integriert werden 
soll, als endliche Summe von m durchschnittsfremden Mengen 4A, dar und erhalten 


I Ka) nid) — 3 ST) udn). (42.8) 


Jedes Integral auf der rechten Seite von (4.2.8) kann mit der gewöhnlichen Monte- 
Carlo-Methode oder einer ihrer bereits betrachteten Modifikationen geschätzt 
werden. Wir setzen voraus, daß das Integral 


„FO utdae) = wtAı) FI) ud) mA) 
‘ 
durch die Summe 
ee ni i _ ff) für 2=ceA,, 
N; iA) 2 10m) mit ga) h Sun. 
abgeschätzt wird. Dabei sind die &,, k = 1,.„n;t=1,...,m, Realisierungen 


der unabhängigen Zufallsgrößen x; mit einer Wahrscheinlichkeitsverteilung 
A(d)/u(A:), @e A;. So ergibt sich 


S To) ulda) = & nr ua) 2 ne) = AN. 


Offensichtlich ist MA[f] = / f(®) u(de). Die Dispersion der Summe % läßt sich 
leicht berechnen. Sie ist gleich 


DR= Far nA 5 Pie) nide) — &rt| Se) ua]. (4.2.9) 
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Es sei nun m = 2, p, = u(Ah), Pa = (As), Rı + Reg = N. Wir werden 9,, Pa, Rı> Ne 
derart annehmen, daß n, = p,N und n, = p,N ganze Zahlen sind. Dann ergibt 
sich 


Da = ls Pte) utin)— | Fre) aa] -z| se day] } 
N u A H p® FR [u ” 


(4.2.10) 


Bei der gewöhnlichen Monte-Carlo-Methode, die für die Schätzung des Integrals 
über den ganzen Raum & angewendet wird, ergibt sich 


1 8 i 
Dr=- Irre) ulde) — | AL) we) = | [fe Ro] 


1 
Pı 


-2| Are ne) | Fre) ne]. 


Da 1/p, >1 und 1/p, >1 ist, ist leicht zu sehen, daß D# < Dx für beliebiges f 
aus L,(z) gilt. Gleichheit tritt hier nur ein, wenn 


Az) S fa) u(de) = u(4,) A K®) u(de) 
ist. 


So führt eine beliebige Zerlegung, bei der die Anzahl der Punkte proportional 
zum Maß der Mengen A, und 4A, gewählt wird, zu einer Verkleinerung der Disper- 
sion im Vergleich mit der gewöhnlichen Monte-Carlo-Methode, Mit anderen Worten, 
es gibt keine solche Funktion aus L,(w), für die die Schichtung mit einer propor- 
tionalen Anzahl von Punkten ein schlechteres Resultat liefert, als die gewöhnliche 
Monte-Carlo-Methode. Wird die Anzahl der Punkte nicht proportional zu den 
Maßen von A, bzw. A, gewählt, so gilt diese Aussage im allgemeinen nicht. 

Setzt man etwa m = 2, n, = ns, u(4,) = 3/4 und u(A,) = 1/4, so erhält man 


x 1 
Dil 1 S Pr) nlda) +2 S Pix) u(dr) 
4, 4 


N, 
= (Zresnao) (Zen); 


Durch Vergleich dieses Ausdrucks mit der Dispersion der gewöhnlichen Monte- 
Carlo-Methode bei 2n, Versuchen überzeugt man sich, daß es eine Funktion gibt, 
für die eine solche geschichtete Auswahl ein schlechteres Resultat liefert als die 
Schätzung mit der gewöhnlichen Monte-Carlo-Methode (z. B. eine Funktion, die 
nur auf A, ungleich Null ist). Wenn man allerdings über einige zusätzliche Infor- 
mationen über die Funktion f verfügt, dann kann man n, und n, so wählen, daß 
D# minimal wird (GELFAND, FROLOw und TscHExzow [1]). 
Aus (4.2.10) erhält man leicht 


1 
2 2 
w?(A,) Dg, PN u’(4A,) Dg - 
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Der Wert p,, für den D% minimal wird, ist gleich 


pP = (Ay) YDg, 
u(A,) YDgı + #(As) YDge 
und die minimale Dispersion ist 


Ti —— 
Darin = zylu(Aı) YDg, + (As) YDgel- 


5. Stochastische Quadraturformeln. Ein universelles Verfahren zur Verkleine- 
rung der Dispersion bei der Monte-Carlo-Methode ist die Benutzung stochastischer 
Quadraturformeln. In diesem Paragraphen werden wir Interpolationsquadratur- 
formeln betrachten, deren. Stützstellen eine Verteilungsfunktion spezieller Art 
besitzen. Es ergeben sich auch eine Reihe von Hilfssätzen, die später gebraucht 
werden. Stochastische Quadraturformel nennen wir eine Formel 


& Ale) = Sp) I) u(de) , (4.2.11) 


wobei die A; und #, Zufallsgrößen und 9, und f gegebene Funktionen sind, so daß 
Rn 

das Produkt 9,f w-integrierbar ist. Die Summe x,[/] = Y 4A:f(x.), die der Formel 
i=1 


(4.2.11) entspricht, werden wir stochastische Näherungssumme nennen. Weiterhin 
werden wir voraussetzen, ohne das besonders hervorzuheben, daß die Summe x,[f] 
eine erwartungstreue Schätzung des Integrals 


I = f gıl®) fie) u(de) 
darstellt und die Koeffizienten gegebene Funktionen der Zufallsgrößen ®; sind: 
4; — A;(,; ...; %n) . 


Als einfachstes Beispiel einer stochastischen Näherungssumme kann die Summe 
n %; 
= 5 RR je) 


dienen, die eine erwartungstreue Schätzung des Integrals J darstellt, wenn die 
#5 + 2 unabhängig sind und die Verteilung u(dx) besitzen. 
Gilt für / = f, mit der Wahrscheinlichkeit Eins die Gleichung 


2 Ada) = S pıla) hl) n(de) , 


so werden wir sagen, daß die Quadraturformel für die Funktion /, exakt gilt. 

Für das Weitere benötigen wir ein Lemma, das die Verallgemeinerung einer 
bekannten Integralidentität auf den Fall eines beliebigen o-endlichen Maßes!) 
darstellt (AnDREIEW [1]). 


1) Für die weiteren Betrachtungen ist es bequem anzunehmen, daß dasMaß wendlich 
oder o-endlich ist. Das wird in der Regel nicht besonders hervorgehoben. Es muß aber 
klar sein, daß der Gebrauch des Ausdrucks w(X%) ein endliches Maß voraussetzt. 


8 Ermakow, Monte-Carlo-Methode 
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Lemma 4.1. Es seien {9}, =], ..,.n, und {y,),j =], .... n, zwei Funktionen- 
systeme aus L,(z). Dann güt die Integralidentität 


T = f un(dQ) det |\p«@;)i| det Ira] = 7! det |Ilp« yu)ll (4.2.12) 
mit 
Q= (Ks +5 X) > Un (dQ) = u(d,) ge ud.) 
und 
(Pi, yr) = S Pıl®) yula) u(de) . 
Beweis. Wir entwickeln die Determinante det g:(z;) (| Nummer der Zeile) 


nach den Elementen der ersten Spalte, wobei A, den entsprechenden Minor be- 
zeichnet: 


PelXı) P(&,) | 
de PR) PM) 2 Pl) 

|Pal@j+1) Pal) -++ Pnlirı)) 

Pe(&n) Ps.) Pn(&n) 


Wir erhalten 


1 = [ nldQ) 2,174 Ayla) det Ihpute) 


= ES nd) = S ul) aldayıa) 
 S[ ntden) (—1) A, S ulde;) pa) det ya) - 


Wir multiplizieren die j-te Zeile der Determinante det ||y.(&;)|| mit @,(@;) und 
integrieren über ihre Elemente. Die Vertauschung der zu integrierenden Zeile 
mit der ersten Zeile ändert den Wert der Determinante um den Faktor (— 17-1. 
Wird jetzt die Numerierung der ersten j — 1 Integrationsveränderlichen so ge- 
ändert, daß x, anstelle von &,, #, anstelle von #,, ..., &; anstelle von ®;_ı gesetzt 
wird, dann ergibt sich 

PH) Pr) + (Pr Yn) 


I=n/ u(d,) -- S u(de,) det |\pr(@ej)ll Yılaz) Yale) ++ Ynlie) 


Pr ur Yu Ber ur YER Soor DuEL ur Er VER WE Er re, 


Yıln)  Yelen) ... Ynlden) 


So haben wir die Ordnung der einen Determinante um 1 erniedrigt und eine Zeile 
der zweiten Determinante integriert. Eine sinngemäße Wiederholung dieses 
Schrittes führt uns offensichtlich zum gewünschten Resultat. Damit ist das 
Lemma bewiesen. 


Unmittelbar aus dem Lemma ergibt sich folgendes Resultat, das ERMAKOWw 
und SoLoTucHın [1] erhielten und das durch Hannscomg [1] präzisiert wurde. 
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Satz 4.1. Wenn 


1. die {p}, i= 1, ...,n, für fast alle x linear unabhängige Funktionen sind, 
wobei @, orthogonal zu P., Ü = 2, ...,.n, und normiert ist, 
2. die Verteilung W,(dQ) der Stützstellen der Näherungssumme 


ee Q) 
ei (4.1.6)) durch die Gleichung W,(dQ) = « A%(Q) un(dQ) mit einer N ormierungs- 
onstanten c bestimmt wird (für orthonormierte op; ist ce = 1/n!), 
dann ist #„|f] eine erwartungstreue Schätzung des Integrals 


S Yıle) FR) u(de) = (9, P)- 


Beweis. Wir setzen zunächst voraus, daß die eu i= |], ...,n, orthonormiert 
sind. In diesem Fall ergibt sich mit y; = 9, = 1, ...,n, und durch Benutzung 
von Lemma 4.1 


S AXQ) unldQ) = n!det Ip» pl = n!: 


also c = 1/n!. Nun wird Lemma 4.1 zur Berechnung von Mx,„[/] benutzt, indem 
man y,(#) = f{&®) und y; = 9, = 2, ..., n, setzt. Dann erhält man 


(4.2.13) 


Mali] = „70 15 AU: ® AQ) und) 


A}; Q) AiQ) Un(dQ) = (9 PM); 


wodurch der Satz für orthonormierte Funktionen g; bewiesen ist. 

Der Fall, daß ,(&) orthogonal zu den übrigen p;(x) ist und alle p; für fast alle x 
(also auf dem Träger des Maßes u) linear unabhängig sind, wird leicht auf den vor- 
hergehenden Fall zurückgeführt. Dazu genügt die Feststellung, daß die Multi- 
plikation einer Spalte mit einer Konstanten und die Addition beliebiger Spalten 
in den Determinanten, die im Zähler und Nenner von (4.2.13) stehen, den Wert von 
#„|/] nicht ändert. Auf diese Weise können alle 9; orthonormiert werden, wobei die 
Größen A(f; Q) und A(Q) mit derselben Konstanten multipliziert werden und z,[/] 
sich nicht ändert. So ergibt sich der bereits betrachtete Fall orthonormierter @:. 
Damit ist der Satz vollständig bewiesen. 


Weiterhin werden wir auf £ zwischen regulären und nichtregulären Funktionen- 
systemen {9}, 7 =], ..., n, unterscheiden. Wir nennen {g;} ein auf & bezüglich 
des Maßes u requläres System, wenn das Maß u„ der Menge {Q:A(@) = 0} gleich 
Null ist. Andernfalls heißt {g;} nichtregulär auf X. Offensichtlich sind die Funktio- 
nen eines auf X regulären Systems auf einer beliebigen Teilmenge von X positiven 
Maßes fast überall linear unabhängig. Für nichtreguläre Systeme gibt es eine solche 
Menge de % positiven Maßes, auf der die o; linear abhängig sind. Es gilt der 


Satz 4.2 (ERMAKOW und SoLorucHhın [1], Ermarow [4]. Wenn die @, 
i=1,..,n, ein System orlhonormierter Funktionen bilden, dann gili unter den 
8* 
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Voraussetzungen von Satz 4.1 die Ungleichung 
n 2 
DS ||fe) - & Wo nie] ui). (4.2.19) 


Bilden die p: ein reguläres System, so gilt in (4.2.14) das Gleichheitszeichen. 


Beweis. Es ist 


Duff] = [ An), 


Im Fall eines regulären ie ergibt sich 


A, 4% 
Da ey mr Anti) — bt 


= (n!)- ı [ta I/@e:)» )» Pa(2%:), ... nl)? Anl (dQ) — —(f, 9) 


Zn ) 


unldQ) — (Pu)? - 


Entsprechend dem Lemma 4.1 erhält man Dx,[/] = 6n — (a, f)? mit 


EN WEN (N 
te 10 


. er. Trennen 


Durch Entwicklung der Determinante ö„ nach den Elementen der letzten Zeile 
erhalten wir ö, = ö&„-ı — (f, n)?. Wegen ö6, = (f, f} folgt 


n n 2 
Du =D - Ehrot =s [re - Eure] nie). 
(= = 
womit der Satz im Fall eines regulären Systems {p:} bewiesen ist. Ist das System 


{gi} nichtregulär, so führen wir die Bezeichnung &,(4) = {Q:4(Q) = 0} ein. 
Dann gilt 


Dx,[/] = f ulf] 


AnldQ)— (f P)?= (n))” far D) unldQ) — (F, pi)? 
Anl) 


< (nd } 2, NE 


was den Satz vollständig beweist. 


Bemerkung. Werden die p; nicht als orthonormiert vorausgesetzt, so bleibt 
der Satz 4.2 gültig. Man muß dann in (4.2.14) die 9; durch Funktionen y; ersetzen, 
die man aus den @; durch Orthonormierung erhalten kann. Diese Behauptung 
wird durch dieselben Überlegungen bewiesen, wie sie beim Beweis von Satz 4.1 
durchgeführt wurden. 


Es sei jetzt f{a) = M„£(&, ©) mit einer Hilbertschen Zufallstunktion &(&, »), 
wobei we Q und {2, B,}} ein Wahrscheinlichkeitsraum ist. Wir wollen nun das 
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Integral J = / @,(#) f{®) u(d&) mit Hilfe einer Quadraturformel schätzen, die 
durch Realisierungen der zufälligen Funktion & für von uns gewählte x-Werte 
gebildet wird. Wie schon früher bezeichnet @ = (&%,; ..., 2,) die Gesamtheit der 
gewählten &-Werte. Wir unterscheiden zwei Fälle. 


Fall A. Für & = x, werden Realisierungen &; = &(&,©:),?=1, ..., n, erzeugt. 
Dabei sind die w; unabhängige Realisierungen der Zufallsgröße . Die Größe 
9 = (01 ..., @,) gehört dem Stichprobenraum {Q,, Ba, An} an. 


FallB. Für x = &, werden die Realisierungen £ bei ein und derselben Reali- 
sierung w erzeugt, d.h., man erhält &; = {(&,o), i=|],...,n (ausführlicher 
darüber siehe Kap. V, $ 1). 


Wir bilden nun die Näherungssumme 
n N 
zul] Adı oder ml ]= Adi 


und werden, wie schon früher, @ zufällig auswählen entsprechend der Wahr- 
scheinlichkeitsdichte #,(@) = cA?(@) im Verhältnis zu 4„. Dann gelten die folgen- 
den Sätze (ERMAKOW [3], GRANoWskI und ERMAROW [1]). 


Satz 43. Es sei {ep}, ?= 1, ...,n, ein System linear unabhängiger Funktionen 
(auf dem Träger des Maßes u), p, sei normiert und orthogonal zu den 9, ® = 2, ..., N. 
Wird x„[&] durch die Gleichung x„[E] = AlE; Q)/A(Q) definiert und ist Q mit der 


- Wahrscheinlichkeütsdichte w,(@) im Verhältnis zu un verteilt, so gelten die Gleichungen 


M.,gXnl&’] = S pı(®) a) u(d) 
und 


Ma,0%nl&] = S Yıl®) fx) u(de) . (4.2.15) 


Beweis. Der Beweis folgt aus der Meßbarkeit von x„[£’] bzw. x„[£] bezüglich 
der Maße A und u bzw. A, und z, und dem Satz von FUuBInt. 
Komplizierter ist der Beweis von 


Satz 44. Wenn die@,i =], ...,n, ein orihonormiertes Funktionensystem bilden, 
dann gilt unter den Voraussetzungen von Satz 4.3 im Fall A 


n 2 
Dante < | |1e) - & um um] nice) + Fre) an, 
im Fall B 
n 2 
ET Ir) EP) 2] n(de) + f 0°) n(da) 


SS Ri&,, &;) Pl) Pilz) u(de,) u(dae,) . (4.2.16) 


i 


5 4: 


Dabei ist 0°(&) = Mu[&(®, w) — f{x)]® und R(&,, &,) die Korrelationsfunktion von 
C(®,o). Für ein requläres System {pi} güt in den genannten Ungleichungen das 
Gleichheitszeichen. 
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Beweis. Wir betrachten den Fall eines regulären Systems {g;}. Der nicht- 


reguläre Fall wird genauso wie beim Beweis von Satz 4.2 behandelt. 
Fall A. Es ist 
AXE,Q) 42 
Dale) |Auen) ne) nn 


4%Q) nn! 


E (Pi di 
und 
Din[2] = (al) S Anldem) S un (dO) [det ||Ei, Pal), --, En)? — (Pu N? - 


Durch Entwicklung der Determinante unter dem Integral nach den Elementen 
der ersten Spalte und Änderung der Numerierung der Veränderlichen ergibt sich 


Din[E] = S And) S un(dQ) (m — 11) At, ..:, 2n) 
— f An(deo) S u(dQ) (m—2) 1) 56 (ar... En) Aplaıs Apr + En) « 


Dabei ist Ayla -- &i-1, irn +, %) = Ar der Minor des i-ten Elements der 
ersten Spalte der Determinante A(£, Q). 
Mit Hilfe der Resultate von Lemma 4.1 erhalten wir 


Di„[E] = / Mdo) [ u(dae) &*a, ©) — (9 B? — (in — 31, 
Ah=/f A„(do) J Hn(dQ) Cds, . 


Durch Entwicklung der Determinante /, nach den Elementen der Zeile, die von &, 
abhängt, und der Determinante A, nach Elementen der Zeile, die von x, abhängt, 
ergibt sich 


In = SAnldeo) S 1uldO) Carson) Emo) &, ED Ansda pıl) Bl) 


mit den entsprechenden Minoren /},; und As,;. Dabei ist A1,; = A2a,,t = 1,..., n—1, 
und A,,; hängt nicht von &, und a, ab. Aus Lemma 4.1 folgt leicht 


mit 


; n—2)! für ij, 
S u(de;)  [ u(den) Audu=|, ) ur v 1 


Daher ist 
J, = (n — 2)! S Mdo,) [ Ado,) [ u(d,) S u(dz) (x, ©ı) (2, a) 2 Pa) Pilz) - 
(4.2.17) 


Nun genügt es, die Integration nach », und &, auszuführen, um das geforderte 
Resultat im Fall A zu erhalten. 
Es ist leicht einzusehen, daß der FallB analog untersucht werden kann, aber 


anstelle von (4.2.17) gelangen wir zu 
J2 = (n — 2)! Aldo) S u(da,) S u(dez) C(&1, ©) Clay, ©) z File) Pilz) » 


(Per 


0 sonst. 


woraus nach Lemma 4.1 unmittelbar (4.2.16) folgt. Damit ist der Satz bewiesen. 


Die Sätze 4.3 und 4.4 erlauben insbesondere die Anwendung der von uns kon- 
struierten Quadraturformeln mit stochastischen Stützstellen für die Integration 
von Funktionen, deren Werte mit der Monte-Carlo-Methode berechnet werden. 
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Wir gehen nun auf einige Sonderfälle und Beispiele ein. Als Beispiel für ein 
reguläres System, das sich auf das Lebesguesche Maß auf dem Intervall [0, 1] 
bezieht, dient das System der Legendreschen Polynome, die auf [0, 1] orthonor- 
miert sind. Dabei ist p,(®) = P;-ı(®) vom Grad « — 1. Die Determinante A(Q) 
ist in diesem Fall bis auf einen Faktor die Vandermondesche Determinante 


AQ)=cdelleill, i=Lh..nk=0,.,n—1, 
die bekanntlich gleich 
AQ=cHmw—-2), Gi=lh.,n-l, (4.2.18) 
i<j 


ist. Aus (4.2.18) folgt unmittelbar, daß das u„-Maß der Menge 19:49) = —=0} 
gleich Null ist. 

Weitere Beispiele regulärer Systeme bezüglich des Lebesgueschen Maßes in 
einem Gebiet D des s-dimensionalen euklidischen Raumes sind Systeme von 
Polynomen in mehreren Veränderlichen und Systeme trigonometrischer Polynome 
in einer und mehreren Veränderlichen. Der Leser kann selbst ohne Mühe weitere 
ähnliche Beispiele finden. Beispiele nichtregulärer Systeme im euklidischen Raum 
in bezug auf ein gegebenes Wahrscheinlichkeitsmaß u sind Systeme stückweise 
konstanter Funktionen. Nichtregulär sind insbesondere die Haarschen Funktio- 
nensysteme, die vielfältige Anwendung in der numerischen Mathematik finden 
(vgl. SoBoL [7]). Sie werden folgendermaßen definiert. 

Wir zerlegen X in 2” durchschnittsfremde Teilmengen d({m, i.); im = 1; ..., 2", 
gleichen u-Maßes. (Wir nehmen an, daß u(&X) = 1 ist.) Die Teilmenge dis, ds)» 
l<ssm, i, =1, ..., 271, definieren wir durch die Gleichung 


d(s,i,) = d(s + 1,2, — 1) ud(s +1, 25,). 


Dann setzen wir 


22 für zeds+1,3,—]), 
am? für zeds+1%,), (4.2.19) 
0 sonst , 


aa)=l, a) = KH, j=P+i, s=l,..,m 


Man prüft leicht nach, daß die Funktionen des Systems {g;} orthogonal und 
normiert sind. Ist u das Lebesguesche Maß, so sind die Haarschen Funktionen 
leicht zu konstruieren. Die Gestalt der ersten Haarschen Funktionen über dem 
Intervall [0, 1] ist in Abb. 4.1 angegeben. In diesem Fall wird das Intervall [0, 1] 
in gleiche Teile zerlegt. A(@) wird Null, wenn zwei Punkte &; und &, = j, in ein 
und dieselbe Menge d(m, i,„) fallen. Man kann auch leicht ein Analogon der Haar- 
schen Funktionen für den Fall angeben, daß die Mengen d(m, i„) verschiedenes 
Maß haben. 

Interessant ist die Feststellung, daß in bezug auf ein diskretes Maß jedes beliebige 
Funktionensystem für n > 2 nichtregulär ist. In diesem Fall erhält man nämlich 
jede Funktion durch Angabe ihrer Werte in diskreten Punkten, deren jeder ein 
von Null verschiedenes Maß besitzt. Dann kann man leicht zwei gleichzeitig von 
Null verschiedene Konstanten c, und c, wählen, so daß e,9, + &9, = 0 im gege- 
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v2 1 X 2 341 


’ -V2 
Abb. 4.1 
benen Punkt gilt. Der Punkt ist aber eine Teilmenge von X mit einem von Null 


verschiedenen Maß. Das beweist die Nichtregularität eines beliebigen Funktionen- 
systems in bezug auf ein diskretes Maß. 


Wir betrachten nun einige einfache Beispiele konkreter Quadraturformeln. 
Beispiell. Es sei £= [0,1], # das Lebesguesche Maß, nr = 2, „(e)=1 
und g(x) = 2 Y3 (« -- 1/2). Dann ist 
1 > 
nl = He) EI + IE (4.2.20) 


= % 
Die Dichte w, der gemeinsamen U von x, und x, ist wy(x}, %) = 6(&, — 23)°, 
d.h., die Wahrscheinlichkeit, ein Paar &,, &, zu erhalten, ist um so größer, je 
größer das Quadrat des Abstandes zwischen x, und x, ist. 
Die Dispersion von xz[f] ergibt sich aus der Gleichung 


I: 1 2 1 2 
Dal) = F Pie) dr — Ri fa) de] _12 | Ste @-4) de] 


Für die gewöhnliche Monte-Carlo-Methode beträgt die Dispersion eines Versuches 
unter den angegebenen Bedingungen 


1 1 2 
/r® de — Bi fix) de] R 


Sie ist also größer für alle Funktionen f, die nicht zu (x — 1/2) orthogonal sind. 
Die Benutzung von x,[/] erfordert allerdings mehr als den doppelten Aufwand 
für einen Versuch im Vergleich zur gewöhnlichen Monte-Carlo-Methode. Ob die 
Anwendung der Quadraturformel x,[f] von Vorteil ist, hängt daher von der Größe 


1 
des Integrals / f{x) (x — 1/2) dx ab. Man kann hier also nur dann eine Antwort 
0 


geben, wenn zusätzliche Informationen über die Funktion f vorliegen. Eine analoge 
Situation liegt auch in anderen Fällen regulärer Systeme vor. 
Anders verhält es sich bei nichtregulären Systemen. 


$2. Allgemeine Methoden der Dispersionsverkleinerung 121 


Beispiel 2. Das Intervall X und das Maß « sind wie im Beispiel 1 gewählt, 
aber p,(x) und @,(x) sind zwei Haarsche Funktionen. Dann ist 


*elfl = (1/2) [fzı) + Fre)] 
und 
23 für (X %s) € Ss ’ 


wol, 22) = r sonst 


Dabei ist 8 die Punktmenge des Einheitsquadrates, die in Abb. 4.2 schraffiert 
worden ist (gleichgültig, ob der Rand dazugehört oder nicht). Daher sind die 
Randverteilungen von x, und x, Gleichverteilungen, aber x, und x, müssen jeweils 
in verschiedenen Hälften des Intervalls [0, 1] liegen. Es ist leicht zu sehen, daß 
wir auf diese Weise zu dem früher betrachteten Fall der geschichteten Stichprobe 
gelangen. Die Dispersion der enthaltenen Näherungssumme kann auch leicht 
durch die Haarschen Funktionen ausgedrückt werden: 


1 X 8 1 2 
Dei = HS re de |Fnear I fremwaell. ana 


Dieser Ausdruck illustriert besonders anschaulich, daß die Schichtung vorteilhaft 
ist, welche Funktion aus L,(#) auch immer zu integrieren ist. Offensichtlich führen 
für n = 2” die Interpolationsquadraturformeln, die für die ersten 2” Haarschen 
Funktionen exakt sind, auf den Spezialfall einer geschichteten Stichprobe, wenn X 
in 2” Teilmengen gleichen Maßes zerlegt wird und alle r; einander gleich sind. 

Es folgen nun noch einige ergänzende Bemerkungen über Interpolationsquadra- 
turformeln mit stochastischen Stützstellen. Wir erhielten bisher einige Aussagen 
über die zweckmäßige Wahl der Stützstellen einer Interpolationsquadraturformel 
(in Form der Verteilungsfunktion der Stützstellen) bei allgemeinsten Voraussetzun- 
gen über f(&), das System g;(@) und das Maß „x vom theoretischen Standpunkt. 
Das bewiesene Lemma und die Sätze gestatten auch eine einfache Verallgemeinerung 
auf den Fall komplexer Funktionen fund 9, =1,...,n. Eine solche Verallge- 
meinerung wurde von Hanpscomg [1] betrachtet. Dort werden auch numerische 
Beispiele ausgeführt. Die Frage, ob W, die einzige Verteilungsfunktion der Stütz- 
stellen ist, die die Erwartungstreue sichert, oder in einem anderen Sinn die beste ist, 


%2 


1/2 


0 2 1 x a 
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wird in den folgenden Paragraphen untersucht. Es besteht aber kein Zweifel, 
daß die Resultate für die Integralberechnung nützlich sein können, wenn wir über 
zusätzliche Informationen über die Funktion f verfügen. 


Die Modellierung einer Zufallsgröße Q mit der Dichte w, ist mit gewissen Schwie- 
rigkeiten verbunden. In jedem konkreten Fall kann man anscheinend die Prozedur 
vereinfachen, aber im allgemeinen Fall ist es schwer, irgend etwas außer der 
v.-Neumannschen Methode vorzuschlagen. Für großes n entsteht eine erste Schwie- 
rigkeit bei der Schätzung des Maximums des Betrages der Determinante, eine 
zweite bei der Berechnung der Determinante. Für nicht zu großes n (in Abhängig- 
keit vom Charakter der Funktionen @,(#) ungefähr n < 15) kann man hoffen, 
einen effektiven Algorithmus ohne ausführliche spezielle Untersuchungen zu 
finden. Im folgenden Kapitel kommen wir auf diese Frage im Zusammenhang mit 
der Interpolation zurück. Wichtig ist auch, daß die Funktionen g; willkürlich sind. 
Damit können verschiedenartige Informationen über die Funktion f berücksichtigt 
werden. Der Bearbeiter verfügt also immer über solche Informationen wie: die 
Funktion f ist „ähnlich‘ einer gewissen einfachen Funktion g:(&). 


Es scheint nützlich zu sein, noch zwei anschauliche Beispiele zu bringen, die 
mit der Berechnung konkreter Integrale zusammenhängen. 


Beispiel 1 (Hawpscomsg [1]). Für die Berechnung des Integrals 


1 # 
J=f +. S [exp (2, + 2%) — 1] da, + dag, = 9,538 - 107 
0.0 
mit einer Genauigkeit von 1% durch die gewöhnliche Monte-Carlo-Methode sind 
etwa 3 - 10° Versuche erforderlich (die Dispersion eines Versuches beträgt 3 - 10710), 
Setztmaar = 1,9, =1,9 = x," X, So bietet die Modellierung der Dichte A(Q) 
keine große Schwierigkeit. Die Dispersion der so erhaltenen Näherungssumme be- 
trägt nur noch 3- 102%, Das bedeutet, daß zum Erreichen einer Genauigkeit 
von 1%, nur etwa 30 Versuche erforderlich sind. Natürlich ist das ein Beispiel 
für eine sehr günstige Auswahl der Funktionen o, und @,. Aber es veranschaulicht 
in gewisser Weise die Möglichkeiten dieser Methode. 


Beispiel 2 (ErmAaKow [1]). Zu berechnen ist 
1 
J = / fi«) sin (2kı) de 
0 


mit einer festen ganzen Zahl k. Wir setzen p,(x) = 1 und p,(x) = sign (sin (2kre)). 
Das System &, und @, ist nichtregulär, und man prüft leicht nach, daß es sich um 
ein System Haarscher Funktionen im Sinn der Definition (4.2.19) handelt. Das 
Intervall [0,1] wird in zwei durchschnittfremde Teilmengen zerlegt. Die erste 
Teilmenge enthält diejenigen x, für die sin (2krx) > 0 ist, die zweite Teilmenge 
diejenigen & mit sin (2krx) < 0. Die Determinante A(x,, 2,) verschwindet, wenn 
sin (2ksex,) und sin (2krx,) gleiches Vorzeichen haben, und ist konstant, A(x,, 23)=2, 
wenn sin (2krex,}) und sin (2krex,) verschiedenes Vorzeichen haben. Die Näherungs- 
summe %,[/] ist sehr einfach 


#[f] = 3 fa) sin (Akrez,) + a2) sin (2krem;)] , 


$ 3. Die Aufgabenstellung und der Begriff der Zulässigkeit 123 


wobei «, und x, folgendermaßen modelliert werden: Man wählt «, und &,. Ist 
P5(&%) Pa(&,) = 1, so setzt man ©, = %, % = Ag. Andernfalls wählt man von neuem 
%, und x, solange, bis die angegebene Gleichung erfüllt ist. Die Dispersion von x, 
beträgt 


Da,[f]= + | f (x) sin? (Ahr) de — ( N fx) sin (2kıee) de) 


1 \2 
- | S Hx) |sin (2krex)| de) | 
0 


Die gewöhnliche Monte-Carlo-Methode ergibt bei der Berechnung von zwei Funk- 
tionswerten 


= + [f(a,) sin (2kra,) + f(&,) sin (2kro,)] , 


0. LP 1 2 
Di = = 7 Pie) sin? (2krr) de — ( fx) sin (2krex) de) ] 


Für niehtnegative Funktionen f erhalten wir daher einen gewissen Vorteil. Dieser 
kann in einzelnen Fällen bedeutend sein. So ergibt sich für /(x) = x 


1 5 nf 
13 32h’ Das DR a 


und für beliebiges k > 1 ist das Verhältnis der Dispersionen D#/Dx, > 2. Die 
Prüfung der Gleichung 93(&,) 92(&%) = 1 kann offensichtlich durch die Prüfung 
ersetzt werden, ob die größten ganzen Bestandteile der Zahlen 2kx, bzw. 2kx, 
beide gerade oder beide ungerade sind. 


D4 = 


» 
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In $2 haben wir verschiedene erwartungstreue Schätzungen für ein Integral 
betrachtet. Vom Standpunkt der mathematischen Statistik sind die Methode der 
Abtrennung des Hauptteils und die Methode der Erniedrigung der Integrations- 
ordnung Verfahren, die direkt erwartungstreue Schätzungen verschiedener Art 
benutzen. Der Vorteil jener Aufgaben, die in der Monte-Carlo-Methode entste- 
hen, gegenüber den Aufgaben der Konstruktion statistischer Schätzungen besteht 
in der Möglichkeit, über die Wahrscheinlichkeitsverteilungen zu verfügen. Das 
kommt anschaulich in der Methode der wesentlichen Stichprobe und bei der An- 
wendung von Interpolationsquadraturformeln zum Ausdruck. 


In diesem Paragraphen werden wir die Untersuchungen von stochastischen 
Quadraturformeln fortsetzen. Vor allem ergibt sich die natürliche Frage, ob W, 
die einzige Verteilungsfunktion der Stützstellen einer Interpolationsnäherungs- 
summe ist, die ihre Erwartungstreue sichert. Es ist leicht zu sehen, daß das nicht 
so ist. Bekannt ist beispielsweise das Resultat von HAMMERSLEY und MorToN 
[1] (antithetic variate method, oder wie wir sagen werden, die Methode der sym- 
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metrischen Stichprobe). In der einfachsten Form besteht sie in der Anwendung 
einer stochastischen Quadraturformel für die Berechnung des Integrals über die 
Funktion f(x) auf dem Intervall [0, 1] von der Gestalt 


he) Bee) =], (4.3.1) 


wobei x auf [0, 1] gleichverteilt ist. 

Die Formel (4.3.1) war die erste stochastische Quadraturformel, die in der 
Literatur betrachtet wurde. Ihr Studium trug wesentlich zur Entwicklung von. 
Arbeiten über die Dispersionsverkleinerung bei der Monte-Carlo-Methode bei. 
Die Formel (4.3.1) gilt exakt für 1 und eine beliebige bezüglich der Geraden x = 1/2 
ungerade Funktion und ist wesentlich einfacher als etwa die Formel (4.2.13), die 
nur für 1 und x exakt gilt. Offensichtlich ist auch ihre Erwartungstreue. Im 
Unterschied zu den Formeln, die in $ 2 betrachtet wurden, wird in (4.3.1) nur eine 
Stützstelle stochastisch gewählt, während die zweite durch diese Wahl eindeutig 
mitbestimmt ist. (Die Verteilungsfunktion der Stützstellen ist ausgeartet.) Aus- 
führlich werden wir Formeln soleber Art in $ 4 untersuchen. Jetzt gehen wir auf 
die allgemeinen Bedingungen ein, die eine Verteilungsfunktion der Stützstellen 
erfüllen muß, damit die Erwartungstreue der Näherungssumme (die nicht not- 
wendig vom Interpolationstyp sein muß) gesichert ist. 

Wir werden Summen der Gestalt 


n 
“nlf] -=2 A,(Q) fi.) 
betrachten, um das Integral 


J=S yıl®) fi) u(de) 
zu berechnen. Dabei ist Q = (&,, ..., 2„) eine mit der Gesetzmäßigkeit U(Q) ver- 
teilte Zufallsgröße, und die A:Q) sind gewisse gegebene Funktionen. Neben der 
Bezeichnung %„[/] werden wir auch die Bezeichnungen 


“nl = Kult; Q] = Kalf; Er + en] 


gebrauchen. Als Kriterium für die Güte einer erwartungstreuen Summe in L,(z) 
werden wir ihre Dispersion benutzen, die als endlich vorausgesetzt wird. Dabei 
beschränken wir uns auf die Betrachtung von Summen, die symmetrisch bezüglich 
der Variablen &,, ..., &, sind und für die U(Q) auch eine symmetrische Funktion 
der genannten Variablen ist. Dies bedeutet vom Standpunkt des gewählten Kri- 
teriums her keine Einschränkung der Allgemeinheit. 

Wenn nämlich #%, und U(Q) die genannte Symmetrie nicht besitzen und die 
Summe #, erwartungstreu ist, dann konstruieren wir folgendermaßen ein symme- 
trisches x, und U(Q). Wir setzen 


Ua 5 Dana) (43.2) 
nlısu<.<insn 
und 


RE dü 
nm 1 23 Kn [f; Wien Ci] FIii (is . %;) . 
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(Man prüft leicht nach, daß Ü bezüglich U absolut stetig ist.) Wenn wir der Ein- 
fachheit halber die Bezeichnung der Variablen und die Summationsindizes weg- 
lassen, dann ergibt sich 


. düÜ 
Mn [4 I m ag TU Ar |mao, 


d. h., x, ist eine erwartungstreue Schätzung. 
Weiter gilt De, = Maulf] — J? und 


- r 
an-mplEr) ran rn 
wegen 
Bl. 
dU du 


Daraus erhalten wir 


D«.[/] = D&lf] 


für alle fe L,(u). Daher ist die symmetrisierte Näherungssumme vom Standpunkt 
der Größe der Dispersion nicht schlechter als die ursprüngliche Summe. 

Eine solche Gesamtheit (x,[/], U(Q)), für die x„[/] für alle fe F erwartungstreu 
ist und Dx,[f] < © für fe F gilt, werden wir im weiteren eine Prozedur der Monte- 
Carlo-Methode (PMCM) im engeren Sinne für die Funktionenklasse F nennen, 
Damit (x„|f], U(Q)) eine PMCM (die Bezeichnung „im engeren Sinne‘ lassen wir 
im folgenden weg) ist, müssen folgende Bedingungen erfüllt sein: 


Bedingung A (Erwartungstreue). Es muß 


S Hl} OldQ) = S Pıla) F®) u(dx) (4.3.3) 


für beliebiges fe F gelten. 
Wenn U in bezug auf das Maß u eine Dichte x besitzt und F eine genügend 
umfangreiche Funktionenklasse ist, etwa F = L,(u), dann kann (4.3.3) in der Form 


S ulda,) Sn (dei) S nldeızı) - Su (davm) ArlQ) uQ) = npılı) (4.3.4) 
für fast alle & geschrieben werden. 
Bedingung B (Endlichkeit der Dispersion). Es muß gelten: 


Di] <® 


für beliebiges fe F gelten. 

Wir werden uns nun mit dem Vergleich der Güte verschiedener Prozeduren 
der Monte-Carlo-Methode beschäftigen. In $ 2 begegneten wir im Zusammenhang 
mit den Haarschen Funktionen dem Sachverhalt, daß man eine Prozedur der 
Monte-Carlo-Methode angeben kann, die in einem gewissen Sinne „besser“ ist als 
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die gewöhnliche Monte-Carlo-Methode für alle Funktionen aus L,(w). Es ist klar, 
daß eine Erscheinung solcher Art ein ausführlicheres Studium verdient. Für eine 
zufällige Näherungssumme x,[/] verwenden wir jetzt die Bezeichnung x[f, @]. Die 
Größe n wird also als fest betrachtet, aber wir unterstreichen die Abhängigkeit 
von der Zufallsgröße @. Wenn es wesentlich ist, auf das Verteilungsgesetz von & 
hinzuweisen, werden wir hier und im folgenden die Bezeichnung Qy verwenden, 
wobei W die Verteilungsfunktion von @ ist, oder Q,, wenn ww die W entsprechende 
Dichte bedeutet. 

Es sei nun eine gewisse Klasse von Prozeduren ? = (K,U), ze#, UTeU, 
und eine Klasse F von Funktionen f, F < L,(u) gegeben. 

Wenn es ein p' = (x’, U’)e P gibt, so daß D#’If, Qu] S Delf; Qu] für alle fe F 
und Da’[f, Qrr] < Dx[}; Qu] für wenigstens ein FE F gilt, dann sagen wir, daß p’ 
über p = (#, U) in P für F dominiert. 

Wir nennen ein p unzulässig in ? für F, wenn es in ? ein p’ gibt, das über p 
für F dominiert. Andernfalls heißt p» zulässig. Der hier eingeführte Begriff der 
Zulässigkeit ist dem oft in der Statistik gebrauchten Zulässigkeitsbegriff für eine 
Lösungsprozedur oder eine Schätzung völlig analog (vgl. etwa Lrumann [1)]). 
Eine für F zulässige Prozedur kann man auch nichtverbesserungsfähig für die 
Funktionenklasse F in der Klasse der Prozeduren $# nennen. 

Der Begriff der Zulässigkeit bezieht sich auf eine Funktionenklasse. Für eine 
gewisse konkrete, genügend einfach zu berechnende Funktion f kann eine un- 
zulässige Prozedur zu einem kleineren Rechenaufwand führen als eine zulässige 
(wegen der Notwendigkeit, x[/, @] zu berechnen). Es ist aber klar, daß man. in. 
einer genügend umfangreichen Funktionenklasse F stets Funktionen findet, für die 
die umgekehrte Behauptung gilt, da der Aufwand zur Berechnung der Funktions- 
werte häufig bestimmend sein wird. 

Aus den Ergebnissen von $ 2 folgt vor allem, daß die gewöhnliche Monte-Carlo- 
Methode für L,(#) sogar in der Klasse von Prozeduren unzulässig ist, in der die 
Näherungssumme gleiche Koeffizienten hat, aber die Stützstellen nicht unbedingt 
unabhängige Zufallsgrößen sein müssen. Daher kann man also behaupten, daß 
die gewöhnliche Monte-Carlo-Methode, eine der einfachsten Integrationsmethoden, 
sogar für die sehr umfangreiche Funktionenklasse L,(z) bei weitem nicht die 
beste ist. 


Wir wählen jetzt ein festes Funktionensystem {9}, *=1L,..,n, F=L;(#) 
und nehmen an, daß x[/] durch die Formel (4.1.6) 


nA 


definiert wird. Wir betrachten die Klasse von Prozeduren P, = (x[f], U), in der 
U die Menge von Wahrscheinlichkeitsmaßen auf & ist, für die «[/] erwartungstreu 
ist. Dann gilt 


Satz 4.5 (ERMAKoOW [4]). Sind die Funktionen 9, i=1, ...,n, in bezug auf 
das Wahrscheinlichkeitsmaß u regulär und mit der Wahrscheinlichkeit 1 beschränkt 
und gibt es eine mit der Wahrscheinlichkeit 1 beschränkte Funktion y(&), die zu 
allen Produkten p:(#) g,(@) und zu allen p;(®) orthogonal ist (4,5 = 1, ..., n), dann 
ist die Prozedur (z[f], W,) unzulässig in P, für La(u). 


$3. Die Aufgabenstellung und der Begriff der Zulässigkeit 127 


Beweis. Wir betrachten die durch die Gleichung 
vaQ-(1+B Eye) WO, ma=l.un, 
2<qa 


definierte Verteilung Y(dQ), wobei y{a) die durch den Satz bestimmte Funktion 
und $ > 0 eine Konstante mit 


1-5 Rz ya) ya) Z 0 


für fast alle & in X, ist. Die Existenz eines solchen $ folgt aus der Beschränktheit 
von (x). Daher ist V(dQ) nichtnegativ. Den Beweis führen wir in zwei Schritten. 


1. Wir zeigen, daß V(X) =1 und M«[f; Q] = J ist. Entsprechend der De- 
finition von x[f] und W,(d®) ergibt sich 


fanrao-] a 2@ (1 +,&,pen vieo) an) 


= Malin) +4, 5, [ AU:0 40 vier) ver und) 


Wegen Mx[f; Qir,] = J (Satz 4.1) genügt es zu zeigen, daß) 


S Alf, Q) A(Q) yia,) yo) UnldQ)=0, mg=lh.,n, p#g, (435) 


und V(&,) = 1 ist. Wir beweisen zunächst die erste dieser Behauptungen. Jede 
Determinante unter dem Integralzeichen von (4.3.5) stellt eine Summe von Pro- 
dukten aus jeweils einem Element jeder Zeile und jeder Spalte, versehen mit 
dem entsprechenden Vorzeichen, dar. Das Produkt dieser Determinanten besteht 
aus Summanden, in die als von 2 abhängige Faktoren entweder 9;,(2) Pia) 
oder f(a,) :,(&%,) bei gewissen iy + ji io h = 1 +, 9 eingehen. Weil f(a,) in 
jedem Summanden nur einmal (als Faktor) enthalten ist, geht in den Summanden 
der (f(&,) P,(@,) enthält, notwendigerweise der Ausdruck g;,(@,) 9.9) dı # Ti 
ij = 1, ..., n, als weiterer Faktor ein, und es gibt darin keinen anderen von x, 
abhängigen Faktor. Daher erhalten wir nach der Integation über das Produkt 
der mit y(&,) y(&,) multiplizierten Determinanten wegen der Orthogonalität von 


(x) zu jedem Paar 9;(2) p,(ae) den Wert Null. Insbesondere ergibt sich für =, 


N = 1 und Sal VAQ=SVdaQ)=1. 
Also ist Y ein Wahrscheinlichkeitsmaß und (4.3.5) bedeutet, daß 
JS «{f} V(dQ) = zur I®) u(d®) 


ist, d.h. Mx[f; Qr] = 


2. Wir berechnen nun die Dispersion von x[fl. Aus der Regularität der @; 
folgt unmittelbar 


Dil}; @r] = Dalf; Om] + £ Rin! 
R = A; Q) pla,) plarz) un(dQ) . 


mit 
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Wir zeigen, daß R< 0 für jedes fe L,(w) gilt. Es ist 
R= SL Ha) Ka) (DH AA, pla,) ya) undQ) , 
P<7Q 47 
wobei A, der Minor des i-ten Elementes der ersten Spalte von der Determinante 
im Integranden ist. Durch entsprechende Überlegungen wie im ersten Schritt 
des Beweises zeigt man leicht, daß eine Reihe von Summanden im letzten Aus- 


druck unter dem Integral nach der Integration Null wird. Damit ergibt sich für 
E der Ausdruck 


R= [2 Fe) Ka) (IH AA pl) Pla5) An(dQ) 
— f {det |Ifle:) yR)» Plz). PnlRi)IN)? unldQ) 
— ES Pla) Ayla) 1nldQ). 
Unter Benutzung von Lemma 4.1 und Satz 4.2 erhalten wir 
5 {det |Ife@) ylar), Pal), --» Fnlaoll}? AnldQ) 
= at [p Plo) ya) nid) — & U Ne Ae)reudn), 
J Pia) Ara) unldE) = (n — DIS PR) y°la) ulde) . 
Schließlich ergibt sich 
Dx1f;Qr] = Dal; Om] — 8.2 (I MR) Gil) vie) nid)? 


Für f= vor mit je L,(a), weil y mit der Wahrscheinlichkeit 1 beschränkt ist, 


erhalten wir Dxlj, Om) > Dxlf, Qr]; womit der Beweis des Satzes abgeschlos- 
sen ist. 


Bemerkung 1. Die Benutzung von V anstelle von W, ist eine Methode, um 
die Dispersion der stochastischen Näherungssumme zu verkleinern. Wenn es m 
linear unabhängige Funktionen %,, ..., Ym mit entsprechenden Eigenschaften wie 
y und m nichtnegative Konstanten ß;, mit 


m 
1+ 3 PB: 3 yıla,) vilaz,) Z 0 für alle x, und x, 
i=1 »<q 


gibt, dann kann man mit einer analogen Methode ein V(”) konstruieren, so daß 


Da{f; Qrem] = Dal; Qi. — Bi EU Ir dia)? 


gilt. Das Problem, ob so eine zulässige Prozedur konstruiert werden kann, bleibt 
hier offen. Es gilt aber der 

Satz 4.6. Wenn x[f] durch die Gleichung (4.1.6) definiert wird, wobei die @:, 
i=], ..,n die ersien mn Haarschen Funktionen sind und $, = (z[f], U) eine Klasse 
von Prozeduren ist, für die UeU eine Dichte in bezug auf das Maß u ist, dann 
ist die Prozedur (»[f], u) für jedes U e U zulässig. 
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Beweis. Der Einfachheit halber beweisen wir den Satz für den Fall n = 2", 
m ganze Zahl. Der allgemeine Fall (vgl. Grawowskı [1]) wird analog bewiesen. 
Die n ersten Haarschen Funktionen sind konstant auf jeder der Mengen d(m, &n), 
im = 1, ..., 2”. Folglich sind die Determinante A(@) und alle ihre Minoren kon- 
stant auf jeder der n! Mengen d,(l,, -.., Zn) der Art 

Anl ++ In) = dm, I) X + X d(m, I.) , 
wobei , #1, ==. == 1, eine beliebige Permutation der Zahlen 1,...,n ist und 
A(Q) = 0 nur außerhalb dieser Mengen ist. Da x[f; Q] nur für solche Q definiert 


ist, für die A(Q) # 0 ist, ist «(@) auch nur für diese @ von Null verschieden. Die 
Summe x[/] hat wegen ihrer Symmetrie die Gestalt 


«[/) = nz f&) 
i= 
mit a2; € d(m, im). Die Bedingung (4.3.3) der Erwartungstreue kann in der Form 


nz / Ma) uQ) un(dQ) = S HK) u(de) (4.3.6) 
für beliebiges f e L,(„) geschrieben werden. Ferner gilt 


MAL] = a" 55 Hm) Hs) u(Q) unldQ) 
-n? £S Pia) ul@) untdQ) +0? &S Hz) Ha) W(Q) unldQ) 


und infolge der Symmetrie 


MA] = nf Pi@) ulde) + (n — Int S fa) Far) uQ) unldO) . 
Wir nehmen nun an, daß die Prozedur p’ = (x, U’) über p dominiert. Dann gilt 
Dalf; Qu] — Dalf; Qu] = S Far) Kae) [ulQ) — WO] undQ) >20 (4.3.7) 
für alle fe L,(u). Aber u und w’ sind nur in den Gebieten dy(ly, ..., }„) von Null 


verschieden. Daraus folgt sofort die Möglichkeit, ein solches f zu wählen, daß die 
Ungleichung (4.3.7) verletzt wird. Damit ist der Satz bewiesen. 


Folgerung. Für den Fall Haarscher Funktionen ist die Prozedur (z[f|, W,) 
zulässig in P, für La(u). 

Wie schon bemerkt, kann man die Quadraturformeln mit stochastischen Stütz- 
stellen für die Integration von Zufallsfunktionen benutzen. Dafür wird der Be- 
griff der Zulässigkeit analog eingeführt. Es sei &(&, ») eine Hilbertsche Zufalls- 
funktion, wobei £ dem auf (2, 9,) definierten Raum 6 der Hilbertschen Funk- 
tionen angehört. Wir bezeichnen mit Z, @=1, ....,n, Realisierungen von {(x, ©) 
füre=x,. Ist dann (x, U) = p eine Prozedur der Monte-Carlo-Methode, so ist 
M„Mox[&] =J, und als Maß für die Güte der Prozedur p kann man die Größe 
D,D.x[£] wählen. Daher unterscheidet sich die Definition der Zulässigkeit von 


.der bisherigen nur dadurch, daß die Funktionenklasss F durch die konkrete 


Klasse & der Hilbertschen Zufallsfunktionen ersatzt wird. Dann gilt 


Lemma 4.2. Notwendig und hinreichend für die Zulässigkeit der Prozedur p 
für 6 ist ihre Zulässigkeit für Le(u). 
9 Ermakow, Monte-Carlo-Methode 
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Beweis. Wegen L,(z)c & ist das Lemma hinreichend. Für jedes feste & ist 
umgekehrt &(a) € L,(z), woraus die Notwendigkeit folgt. Daher sind die nicht 
zu verbessernden Prozeduren für eine umfangreiche Klasse deterministischer 
Funktionen auch für die Zufallsfunktionen nicht zu verbessern. Dies weist auf 
die enge Beziehung der von uns betrachteten Aufgaben zu Aufgaben der Versuchs- 
planung hin. Für zulässige Prozeduren gibt uns U die Information über die 
Lage der günstigen (im Sinne nicht zu verkleinernder Dispersion) Stützstellen 
einer Quadraturformel. In Kapitel V wird dieser Zusammenhang ausführlicher 
untersucht. 


$ 4. Stochastische Quadraturformeln mit einer freien Stützstelle 


In $ 3 wurde gezeigt, daß es unendlich viele Verteilungsfunktionen für die Stütz- 
stellen einer Näherungssumme gibt, die ihre Erwartungstreue sichern. Außerdem 
ist eine bestimmte Reduktion der Aufgabenstellung möglich, wenn man sich auf 
die zulässigen Prozeduren beschränkt. Dabei soll noch einmal unterstrichen wer- 
den, daß in der Monte-Carlo-Methode die Unzulässigkeit einer Prozedur (im Sinn 
des vorigen Paragraphen) noch nicht ihre Unbrauchbarkeit für die rechnerische 
Anwendung bedeutet. Der Rechenaufwand bei Anwendung einer unzulässigen 
Prozedur kann kleiner sein als bei Anwendung der zulässigen Prozedur. Ist freilich 
die betrachtete Funktionenklasse genügend umfangreich, dann gibt es in dieser 
Klasse immer solche Funktionen, daß der für die Funktionswerteberechnung not- 
wendige Aufwand den für die Berechnung der entsprechenden Quadraturformel 
notwendigen Aufwand übersteigt. Dadurch erklärt sich einerseits die Notwendig- 
keit, zulässige Prozeduren zu studieren. . Andererseits sind die zulässigen Proze- 
duren nicht unbedingt in allen Fällen komplizierter als die unzulässigen, wie wir 
im weiteren sehen werden. 

Anschließend wird eine spezielle Klasse zulässiger Prozeduren der Monte-Carlo- 
Methode studiert, die stochastischen Quadraturformeln mit einer freien Stütz- 
stelle. ERMAaKoWw [2] schlug vor, diese Formeln als Verallgemeinerung der Methode 
der symmetrischen Stichprobe zu betrachten. Ihr systematisches Studium wurde 
durch GrAanowskı [1] bis [3] vorgenommen. 


Der allgemeine Gedankengang bei der Herleitung von Quadraturformeln mit 
einer freien Stützstelle als Interpolationsquadraturformel besteht in folgendem. 
Es sei x„[f] die Interpolationsnäherungssumme für die Funktion fe L,(n): 


zul) = a nn, (4.4.1) 


die für die orthonormierten Funktionen 9; € L,(u), © =], ...,n exakt gilt. Folgt 
man den allgemeinen Ideen bei der Herleitung deterministischer Formeln vom 
Gaußschen Typ, so muß man erreichen, daß die Quadraturformel J = K,[/] auch 
für die Funktionen @y-+41 +» &n+m aus dem vollständigen orthonormierten Sy- 
stem {gp;} exakt gilt. Wie schon in $ 1 bemerkt, müssen dabei die Stützstellen 
> +, %n auf der Hyperfläche liegen, die durch die Gleichung 


Agn+r Q) = det ||Pn+rl&:); Polar); - Pnlı)l| = 0 (4.4.2) 
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definiert wird. Genauso kommen wir zur Herleitung einer stochastischen Qua- 
draturformel, deren Stützstellen auf der Hyperfläche (4.4.2) verteilt sind. Diese 
Aufgabe ist bedeutend schwieriger als die entsprechende deterministische Auf- 
gabe. Das liegt daran, daß wir Beziehungen zwischen den stochastischen Stütz- 
stellen finden müssen, die nicht’ aus den Gleichungen (4.4.2), sondern aus der 
Bedingung der Erwartungstreue der sich dabei ergebenden Näherungssumme 
#„[f] folgen. Daher kann die stochastische Quadratur nur in dem Fall durehge- 
führt werden, in dem die Gleichung (4.4.2) höchstens eine freie Stützstelle besitzt. 


Nun sei (%, W, «) ein Maßraum und 


ll = & Ada) Ko) 


eine Näherungssumme (nicht unbedingt vom Interpolationscharakter), für die 
alle Stützstellen Funktionen einer Stützstelle sind, etwa der ersten 


2 = T;-ıl,) = d,asN. (4.4.3) 


Die Stützstelle x, sei dabei zufällig gewählt. Wir werden annehmen, daß die Ab- 
bildungen 7, eine Funktionaldeterminante |®;| besitzen. Es soll also die Radon- 
Nikodymsche Ableitung des Maßes » nach dem Maß u mit »(A) = u(T(A)), AEN, 
existieren. 

Ist daher die Stützstelle &, in X mit der Dichte « in bezug auf das Maß u verteilt, 
so ist die gemeinsame Verteilung der Stützstellen &,, ..., „im Raun ZW =%x 
x "x & (n Faktoren) ausgeartet: diese Stützstellen sind auf der Hyperfläche 
in X) verteilt, die durch die Beziehung T';, definiert ist (insbesondere wird das 
für eine Interpolationsquadraturformel mit stochastischen Stützstellen eine Hyper- 
fläche der Gestalt (4.4.2)). 


Stochastische Quadraturformeln, deren Stützstellen durch die Beziehungen 
(4.4.3) miteinander verknüpft sind, werden wir nun stochastische Quadratur- 
formeln mit einer freien Stützstelle nennen. 

Wenn wir uns nach den Überlegungen von $ 3 richten, dann können wir uns 
auf die Betrachtung symmetrischer Quadraturformeln beschränken. Dazu wird 
angenommen, daß die von den Stützstellen geforderten Beziehungen symmetrisch 
sind (d.h., alle Stützstellen &,, ..., 2%. sind gleichberechtigt. Eine Symmetrie 
solcher Art führt uns zu folgenden Forderungen, die an die 7'; zu stellen sind: 


Tr, i=0,.,n—1, (4.4.4) 
mt T=IT, und m-7T +1, i<n. 
Wir werden also fordern, daß die Abbildungen 7, eine zyklische Gruppe der 
Ordnung » bilden, die durch die Abbildung 7 erzeugt wird. Dann gilt der folgende 


Satz 4.7. Die symmetrische stochastische Quadraturformel mit einer freien Stütz- 


stelle 
“lf] = S Pıla) Fr) ulde) (4.4.5) 


soll für die orthonormierten Funktionen 9, ..,gYy exakt gelten, und die freie Stütz- 
stelle besitzt die Verteilungsdichte u(&#,) in bezug auf das Maß u. Daher ist die Summe 


g9* 
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Alf] genau dann eine erwartungstreue Schätzung des Integrals J, wenn die Ab- 
bildungen T, des Raumes & dem Gleichungssystem 


n 
2 Pal) ya) IBi-ı = 0, gq=2,.,N, (4.4.6) 


(fast überall in bezug auf das u-Maß) genügen. Die Koeffizienten der Näherungs- 
summe werden dabei durch 


9) IPi-ıl 


A(Q)= — : i=L,.,n, (4.4.7) 

2 pi) |D:-ıl 

bestimmt, und u(s#,) hat die Gestalt 
ua) = N) 3 gie l9-, - (4.48) 


wobei g(a) eine en oe nichtnegative Funktion mit 


3 > glae:) =1 (moda) (4.4.9) 
ist. ei 


Beweis. Notwendigkeit. Aus der Symmetrie der Summe x,„[/] und den Be- 
ziehungen für T, ergibt sich 


Ayla) = Ayla) = AlTi-ı(@)). i=1..n, 
und 


Mulfl = f = A,lT'-Xx,)) ue,) T'-R,)) ulaz,). 
Nun gilt aber 


[ Ti-\(&,)) HT',)) u(2,) u(da,) 
= F Ayle) fe) u) |B1_ı alde) 


| Al A, AM en en) fix) u(de) . 


So erhält die Rn ea ki Erwartungstreue von x,[f] folgende Gestalt: 


Malfl= f via) Ha) 3 el uldz) -[ fix) ıla) u(de) 


für eine beliebige Funktion fe Er ; ergibt sich fast überall 


Al) 5 en =), weX, (mod u) (4.4.10) 
i=1 i— 


Weil aber 71-1 — Tr-i-1 wegen (4.4.4) gilt, ist die letzte Gleichung äquivalent 
zu 


A,(x) = zZ u(T”(@)) Bm = pl). (4.4.11) 
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Aus der Formel für die Funktionaldeterminante einer zusammengesetzten Ab- 
bildung ergibt sich 


Id.) = 17 | Im), Ki=lh..n-l. (4.4.12) 
Folglich gilt i 
|Dirr@)l 
DT) = EL, 4.4.13 
BE) = Te (4.4.13) 


Weiterhin gilt 


Su) u(de) = S ulTe)) wilnde), i=0.,n—1, 
und daher ist 


n—1 
S wx) u(de)=: nAfz u(T*(&)) |D;| u(de) 


n—1 n 
= fm 2 7”) = ra) |B;-ıl ulde) =1. 


Die notwendige Normierungsbedingung für die Funktion (a) ist also erfüllt. 
Schließlich ergibt sich 

AlT*e)) * 

But) 
Aus (4.4.10) und (4.4.14) folgt 

A,®) Ip Yıl®) 9 

A,(T%a))  HlT*@)) IDie)l ’ ; 

und damit 


= leo m) IB. 


Soll diese Quadraturformel für die zu o,(#) orthogonalen Funktionen 9y(#), +... Fx(®) 
exakt gelten, so folgt jetzt die Gültigkeit von (4.4.6). Soll die Formel außerdem 
für p,(8) exakt gelten, so ergibt sich 

A, (a) FaREN Yıl%,) 2 
= ia) IBi-ıl 


er uTe)) |Öıla)| = pılT*@)), (mod u) (4.4.14) 


., n—1l, (mod 4) (4.4.15) 


Setzt man diesen Ausdruck für A,(#,) in (4.4.14) ein, so erhält man 
n 
zZ rn) On = 2 He) 1O.-ıl. (4.4.16) 
Wir stellen jetzt w(&,) in der Form 


ua) = ge) P3 gi) |D:_ıl 
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dar. Dann gilt 


Tue) 2 
2 uT”(&))= nn zZ ea) IDi-ıl. 


Mit (4.4.16) ergibt sich daraus, daß die Funktion g(a&) der Bedingung 
1 #-1 


— 5 g(T"(&)) = 1 (mod 
ENT") =L (mod m) 


fast überall genügt, was mit (4.4.9) gleichwertig ist. 


Hinlänglichkeit. Die Abbildung 7',, die X in sich abbildet, soll der Forderung 
(4.4.4) genügen, die Näherungssumme wird durch die Gleichungen (4.4.7) und die 
Verteilungsdichte der Stützstelle x, durch die Gleichung (4.4.8) bestimmt. Dann 
folgt aus (4.4.7) unmittelbar 


” 1 fü j=l 
A (0) = Ü 
a P für j=2,..N. 
Das bedeutet aber, daß die Quadraturformel für die Funktionen @,; ..., 9x exakt 
gilt. Schließlich ergibt sich 


gr) 
N. 


Marl / Fre ID war) 


= I Ka) nt 3 ar) ulday) = ii fl@) 9ı(@) ud) . 


Damit ist der Satz bewiesen. 


Für die Herleitung einer stochastischen Quadraturformel mit einer freien Stütz- 
stelle, die für gegebene Funktionen 9, @=1,.., N, exakt gilt, muß man also 
solche Lösungen &; = T;_ı(,), ©=2,...,n, des Gleichungssystems (4.4.2) fin- 
den, die den Raum X in sich abbilden. Dabei stellen wir fest, daß man als Funk- 
tion g(@) mit den im Satz genannten Eigenschaften insbesondere 


2 
ga) =) 
Enid IBi-ıl 


wählen kann. Dann hat wegen (4.4.8) die dieser Wahl von g(#) entsprechende 
Verteilungsdiehte u(&) unabhängig von der konkreten Gestalt der Abbildungen T7'; 
die folgende Standardform: 


ur) = pie). 


Anschließend werden auf der Grundlage von Satz 4.7 als Beispiel einige Qua- 
draturformeln mit einer freien Stützstelle hergeleitet, die für ein gegebenes Funk- 
tionensystem exakt gelten. Wir legen hier immer das Lebesguesche Maß zugrunde, 
so daß die Forderung nach der Existenz der Funktionaldeterminante der Abbil- 
dung 7’, in diesem Fall der Forderung nach stückweiser Glattheit dieser Abbildung 
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äquivalent ist. Daher wird das System (4.4.6) im allgemeinen ein nichtlineares 
Differentialgleichungssystem sein. Außerdem nehmen wir immer an, daß 
(#8) = const ist und dementsprechend u(®) = gi(#) = const gilt. 


1.2&=[-1, +41), pa) = 1/Y2, pa) = Y3Rx, n= 2. Das System (4.4.6) 
führt hier zu der Differentialgleichung 
da| _ 
da, 


Wir suchen stückweise glatte Lösungen der Gleichung (4.4.17). Solche Lösungen 
sind die drei folgenden 


BR‘ 


(4.4.17) 


& 


2 _ NR Lu —6 
ge (e x) für 2, € [-6,0), (4.4.18) 
—( — at)? für z1€E[0,c], 
2 211/2 ü 
u) Fr RN, (4.4.19) 
—(2 +12 für 1 >0, 
2 _ Al Be 
ge (AU für Ss —c, (4.4.20) 
— (a? — eV? für 2, >e 


mit einer beliebigen Konstanten ce > 0. 

Weitere Lösungen des Systems (4.4.17) sind verschiedene stückweise stetige 
Kurven, die aus einzelnen Teilkurven dieser drei Lösungen zusammengesetzt 
sind, so daß die sich ergebende Funktion umkehrbar eindeutig ist. Ein Beispiel 
ist etwa 

(? — ad)? für 2) €[—c,0), 


I—( +2 für u >0O. 


Wählt man ce = 1 für (4.4.18) und c = 0 für (4.4.19) und (4.4.20), so erhält man 
die folgenden beiden Lösungen von (4.4.17): 


%= 


BR (1—a4)V2 für z,e[—1,0), 
- —(1- a2 für z,€[0,1] 
und 
uyu-—ı für = € [—1; +1] ’ 


die beide eine umkehrbare eindeutige Abbildung des Intervalls [—1, +1] auf 
sich definieren und der Symmetriebedingung (4.4.4) genügen. 
Die entsprechenden la a haben die Gestalt 


»D/] = et nr m] [xl Aa) + Iaıl Aze)] (4.4.21) 
mit ai +2 = |], 20, <0 und 
«Di = Kar) + Hm). (4.4.22) 


Die der Näherungssumme (4.4.22) entsprechende Quadraturformel ist identisch 
mit der Formel (4.3.1). Wie schon in $3 bemerkt wurde, besteht in der An- 
wendung dieser Formel und ihrer Verallgemeinerungen (HAMMERSLEY und MORTON 
[1], Morrox [1]) der Inhalt der Methode der symmetrischen Stichprobe (antiüthetic 
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variate). Die Monographie von. HAmMERSLEY und Hanpscomg [1] enthält eine 
ausführliche Übersicht über Arbeiten, die zu dieser Methode Beziehung haben, 
sowie die entsprechende Bibliographie. 

Die der Summe (4.4.21) entsprechende Formel erhielt als erster Graxowskt [2]. 
Wie schon bemerkt, gelten beide Formeln exakt fürf=1lundf=«. Vergleicht 
man die Summen (4.4.21) und (4.4.22) mit (4.2.20), so stellt man leicht fest, daß 
sie (besonders (4.4.22)) wesentlich einfacher anzuwenden sind als (4.2.20). 

2.%X=[—-1, +1], gie), i=1,2,3,4, sind die normierten Legendreschen 
Polynome vom Grad © — 1. Weil g, und @, ungerade Funktionen sind, erfüllen 
wr mit = —- u ze und y = —ı=y die erste und dritte Gleichung des 
Systems (4.4.6) bei beliebiger Abhängigkeit zwischen x und y. Das System (4.4.6) 
wird so auf eine Differentialgleichung 
dy| Tal) __ 321 
de | Pd) 3 1 


zurückgeführt. Eine ihrer Lösungen lautet 


ee (+) (x + y4— 322) für xe[-10), 
(4) (x — Y4 — 32?) für ze [0,1]. 
Die entsprechende Näherungssumme hat die Gestalt 


li = . sy {ire) + nee 


3a + Va 32) 
+ [fy) + KW) Be +y4—322]} (4.4.24) 


wobei y durch (4.4.23) definiert wird. Die Abbildung (4.4.23) genügt allerdings nicht 
den Symmetriebedingungen (4.4.4). Um die Erfüllung dieser Bedingungen zu 
sichern, kann man eine entsprechende Abbildung T in folgender Weise definieren: 


Ale +y4—32) für wel-—l, -), 
Lan " 
(«) = (5) («+ ya 32) für ze[l-4,0), 
- 4) (e — y4—32) für zelo, =) R 
A4)(&—y4—322) für we 5 1]. 
Dann ist 7? —= — T° und folglich 7? = 7°, Die symmetrische Näherungssumme, 
die auf der Grundlage dieser Abbildungen aufgestellt wird, fällt allerdings (bis 
auf die Numerierung der Stützstellen) mit der Näherungssumme (4.4.24) zu- 


sammen. Beide Quadraturformeln sind also äquivalent. Wir bemerken noch, 
daß sich aus (4.4.24) für = 1 die bekannte Simpsonsche Formel ergibt. 


3. Es sei X ein Gebiet des s-dimensionalen euklidischen Raumes, das symme- 
trisch in bezug auf den Koordinatenursprung gelegen ist. Wenn |X| das Volumen 
des Gebietes X bezeichnet, dann gilt die Quadraturformel 


f fa) de = n —2,)] (4.4.25) 
& 


(4.4.23) 


- 
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exakt für Konstanten und für alle Polynome ersten Grades in s Veränderlichen. 
Die Stützstelle &, ist im Gebiet X gleichmäßig verteilt. Diese Formel stellt das 
s-dimensionale Analogon der Formel (4.3.1) dar (vgl. Morrox [1]). 

4. Die Menge & sei der Einheitskreis &? + 23 = 1. Als Funktionen 9, i = 1, 
2,3,4, werden (1, Cg%ı; Ca%y, 64%j%, gewählt, wobei, die c, geeignete Normierungs- 
konstanten. sind. 

Wir suchen nun die einfachste symmetrische stochastische Quadraturformel mit 
einer freien Stützstelle 


fe de = iR: ei KT'-e)). (4.4.26) 


GRANOWSKI [1] zeigt in einer Arbeit, daß die gestellte Aufgabe durch eine ortho- 
gonale Abbildung 7 gelöst wird, deren Matrix folgende Gestalt hat (wir bezeichnen 
sie mit demselben Buchstaben T): 


1 v3 
» ® 
3 1 

4 TE 

T stellt also eine Drehung um den Winkel 120° dar. Dann ist 

ı 3% 

u 
3 _ı 
=: © 


und daher || =1, ?=1,2. Man kann zeigen, daß die dieser Abbildung 7’ 
entsprechende Quadraturformel die einzige Lösung der gegebenen Aufgabe dar- 
stellt, die die Gestalt (4.4.25) hat. In derselben Arbeit wird dieses Resultat auch 
auf den Fall einer s-dimensionalen Kugel verallgemeinert. 

Wir wollen nun ausführlicher solche stochastischen Quadraturformeln mit einer 
freien Stützstelle studieren, die für 92) =1 exakt gelten. Nach (4.4.7) und 
(4.4.8) haben solche Formeln folgende Gestalt: 


f fi@) uldr) = OD "5 re) Di, 


Ba 0 (4.4.27) 
i=0 
wobei die Stützstelle x in X mit der Dichte 
n—1 
ua) = I 210 (4.4.28) 


nu(&) i= 
in bezug auf das Maß u Vorteil ist. Die Abbildung 7’ genügt dabei den Bedingungen 
(4.4.4) und die Funktion g(x) > 0, ze X, der Bedingung (4.4.9). 

Um eine Abbildung 7' mit den gewünschten Eigenschaften zu finden, wird die 
folgende Konstruktion angewendet. Es werden Teilmengen d,c A, i=1, ..., n, 
mit folgenden Eigenschaften betrachtet: 


ud)>0, uldınd)=0, «( U a) = u(k), (4.4.29) 
i=1 


20 an RER u 
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Nun sei T eine solche Abbildung der Menge X, die jede Menge d,, auf eine Menge d,, 
(k +# I) in Übereinstimmung mit einer gewissen zyklischen Permutation 


(; EG ) 
ee "re = 


der Länge n abbildet. Dann bilden die Abbildungen 7’, © = 0, ..,n — 1, eine 
zyklische Gruppe A der Ordnung n. Dabei gelten für die Funktionaldeterminanten 
|d;| die Formeln (4.4.12) und (4.4.13). Aus diesen Formeln folgt, daß die der 
Beziehung (4.4.27) entsprechenden Näherungssummen x„[f] invariant bezüglich 
der Abbildung 7' sind: 


zalf; 2) = “lt: T(@)] . (4.4.30) 
Für aa meßbare Funktion g werden wir die Größe 


En -E g(T'(x)) = (gie)).n 


Mittelwert der Funktion g im Punkt x nach der ini Al nennen. 
Die Bedingung (4.4.9) kann daher in der Form 


<a). — 1 (fast überall) (4.4.31) 


geschrieben werden. Aus (4.4.30) und (4.4.31) folgt, daß die Momente M[x,[f, 2,11%; 
q=1,2,..., für alle Dichten vw, der Gestalt (4.4.28) gleich sind. Insbesondere 
kann man 


gie) = (2, 50, a) 


setzen. Hier folgt die Richtigkeit der Bedingung (4.4.31) unmittelbar aus (4.4.12). 

Bei einer solchen Wahl der Funktion g erhalten wir u(x) = (u(&%))"', so daß 
die freie Stützstelle= immer als gleichverteilt in X angenommen werden kann. 
Das wird auch weiterhin vorausgesetzt. Wir betrachten nun eine auf X gegebene 
Funktion 9 der Gestalt 


pi) = ha) 2 ALL s (4.4.32) 


wobei h eine he Funktion mit (Ah). = const ist. Dann gilt auf Grund von 
(4.4.12) 


+(T“(®)) = re > IB: 


und fast überall 
EAU x] = ulX) ch), a const . (4.4.33) 


Die Gleichung (4.4.33) besagt, daß die Quadraturformel (4.4.27) für alle Funk- 
tionen p der Form (4.4.32) aus L,(„) exakt gilt. Man beweist auch leicht die um- 
gekehrte Behauptung: Jede Funktion aus L,(w), für die die Quadraturformel 
(4.4.27) exakt gilt, ist in der Gestalt (4.4.32) darstellbar. Daher gilt der 
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Satz 4.3. Eine symmeirische Quadraturformel (4.4.27) mit einer freien Stützstelle 
gilt für genau die Funktionen aus L,(u) exakt, die in der Form (4.4.32) darstellbar 
sind. 


Satz 4.8 stellt eine unmittelbare Verbindung her zwischen der gegebenen zy- 
klischen Gruppe von Abbildungen T* und der Funktionenmenge, für die die 
Quadraturformel (4.4.27) exakt gilt. Das Resultat dieses Satzes liegt dem Beweis 
des nächsten Satzes 4.9 zugrunde. 


Eine wichtige Eigenschaft der stochastischen Quadraturformeln mit einer freien 
Stützstelle ist die Zulässigkeit der ihnen entsprechenden Prozeduren in einer ge- 
nügend umfangreichen Klasse von (Integrations-)Prozeduren. Zur Vereinfachung 
der Darstellung werden wir jetzt auch die Sprechweise „Zulässigkeit einer Qua- 
draturformel‘“ gebrauchen. Dann gilt der 


Satz 4.9. Die stochastische Quadraturformel (4.4.27) mit einer freien Stützstelle 
ist in der Klasse aller stochastischen Quadraturformeln für die Klasse L,(u) zulässig. 


Beweis. Wir nehmen das Gegenteil an. Dann gibt es entsprechend der De- 
finition der Zulässigkeit eine Prozedur (2,[/], %), die über die gegebene Prozedur 
(z„[f}, «) auf der ganzen Klasse L,(u) dominiert und die wie die betrachtete Proze- 
dur folglich auch für dieselben Funktionen fe L;,(z) exakt gilt. 


a) Wir zeigen zunächst, daß in diesem Fall %,]/f] = J für alle die Funktionen p 
der Gestalt (4.4.32) mit . 
ha) <sO<w, zeX (fast überall) (4.4.34) 
exakt gelten muß. (Es ist zu bemerken, daß solche Funktionen $ zu L,(w), aber 
nieht unbedingt zu L,(z) gehören.) 
Wir betrachten nun eine Folge von Funktionen {px}: 
ge) für P@lsN, 
Ex(®) = N für oa) > N ’ (4.4.35) 
—N für @)<—N, 
wobei @ eine beliebige Funktion der Gestalt (4.4.32) ist. Aus (4.4.34) und (4.4.35) 
folgt 
Pr®) El) fast überall fürN— mw, (4.4.36) 
9 <lelel(u), N=12,... (4.4.37) 
Daraus ergibt sich nach dem Lebesgueschen Satz 
S Exu(dae) > f puldae) für No». (4.4.38) 


Weil dabei |ox| < X ist, gilt px € Le(u). Daher müssen in Übereinstimmung mit 
den von uns gemachten Voraussetzungen über (#,[/], @) folgende Aussagen gelten: 
Mälpx; 21] = S Pu(®) u(d) (4.4.39) 
und 
D[%,[9x; 25]]) = Di“.[pr; ul] ; Na; 2 (4.4.40) 
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Weiterhin folgt aus (4.4.27), (4.4.37) und (4.4.32) bis (4.4.34) 


“ulP5] S Anllpl] = nu) <Ihiy.n< CulK) ; (4.4.41) 
Aulen]) > *ul®] für No, (4.4.42) 
Zulen] > #ulp] für Nom. (4.4.43) 


So ergibt sich nach (4.4.41) und (4.4.42) und unter Benutzung des Lebesgueschen 
Satzes 


Milo ; #u]] > Mlxalp; zul] - 


Da die Quadraturformel x,[f] = J exakt für Funktionen ı gilt, folgt hieraus und 
aus (4.4.38) für N — oo 


Diz,[px; 24] >09: 
Nach (4.4.40) ergibt das 

D[%.[px ; #;]] > 0 
für N — oo, woraus in Übereinstimmung mit (4.4.39) die Existenz einer Funk- 
tionenfolge {g,,} mit 

AnlPn.] Ge S On,t(de) “Te 0 


für rg —> 00 folgt. Zusammen mit (4.4.43) und (4.4.38) kann man daraus schließen, 
daß %[p] = S pulde) ist. Damit ist die Behauptung des Teiles a) bewiesen. 


b) Wir setzen in (4.4.32) h(x) = h,(a@) mit 


hıle) = h BE ME: (4.4.44) 
1 für xeE d; , 


Weil (Au). = 1/n ist und die Funktionen A, der Bedingung (4.4.34) genügen, 
muß gemäß a) die Formel %,[/] = J exakt für die diesen %, entsprechenden Funk- 


tionen 9; der Gestalt (4.4.32) gelten. Daraus folgt, daß das Verteilungsgesetz Ü 
der Stützstellen in der stochastischen Näherungssumme %, so beschaffen sein muß, 
daß in jede Menge d,, © =1,...,n, mit der Wahrscheinlichkeit 1 eine der n sto- 
chastischen Stützstellen x; fällt, da andernfalls für ein gewisses ö mit positiver 
Wahrscheinlichkeit 


Knlpı] = 09 + S Pinılde) 
gelten würde. Da die Quadraturformel für die Funktionen p, exakt gelten soll, 
erhalten wir daher aus (4.4.32) und (4.4.3) 

er n—1 

Ay » En) (3 ou) = u(k). 

e- T=a4 

Daraus folgt, daß die Näherungssumme %,[f] folgende Gestalt haben muß: 
I.) 


n—1 2 
(z 191) 
i=0 =: 


[4 


n 


Anlf] = u(&) 2 (4.4.45) 


- 
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wobei man ohne Beschränkung der Allgemeinheit annehmen kann, daß 
2,€d, = Teld,), gel, n, (4.4.46) 


gilt. Ist daher p eine beliebige der in a) betrachteten Funktionen dann muß nach 
(4.4.32) 


Alp] = ur) & h(z,) = const = nu(&) (hy.n (4.4.47) 
gelten. Es sei jetzt 
h(«) für  zecd, 
h1,.e) = 1 —h(T!=2(@)) für  @ed,, 
0 für zä4d,ud, 


mit |k(a)| <e< 0, zeX, Dann ist (hy. 0, und aus (4.4.47) und (4.4.46) 
folgt die Beziehung (fast überall bezüglich U) 

hı,al&,) + Rı,gl&,) = hl) — h(T!-«(&,)) =0 
für alle beschränkten Funktionen h. Aber das ist nur dann möglich, wenn 


x, = Tı-\e,),g= 2, ...,n, ist. Daraus folgt dann wegen (4.4.45) und (4.4.31), 
daß %,[/] und x,[/] zusammenfallen müssen. Weil % in der Form 


= 1. 

A 
mit meßbarer Funktion I), g(a) > 0, dargestellt werden kann, folgt aus der 
Erwartungstreue genau wie im Beweis des Satzes 4.7, daß 9 die Bedingung (9).u = 1 
erfüllen muß. Damit ist Teil b) und zugleich der ganze Satz bewiesen. 


ae) = 


Wir nehmen nun an, daß h(&) eine beliebige Funktion aus L,(u) ist. Wir setzen 
Ale) = hi) — (hle)).u und A,(®) = (h).u. Dann ist A(x) in der Form his) 
= h(@) + h,(®) mit (hy).u = 0 darstellbar, wobei h,(x) invariant bezüglich der 
Abbildung 7 ist, also h,(7'(&)) = hz(x) fast überall gilt. Aus |®,| = 1 folgt dann 


n—1 
210121. 
i=0 
Daher ist eine beliebige Funktion f(x) € L,(#) in der Form 
1 n 
fa) = (hıl®) + Ayla) LIDL 


mit h, + hy € Lz(u) darstellbar. 
Mit Satz 4.8 und der Invarianz der Funktion h, ergibt sich daraus 


#nlf; e] = ul&) Arie) . 
Aus dieser Beziehung folgt unmittelbar 


Satz 4.10. Die Dispersion einer Näherungssumme der Gestalt (4.4.27) mit einer 
freien Stützstelle ist gleich dem Produkt aus dem Maß der Menge & mit der in der 
Metrik von L,(u) gemessenen Entfernung von der Funktion h,(@) (die in die Dar- 
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stellung (4.4.32) des Integranden f eingeht) bis zum Unterraum jener Funktionen 
aus L,(u), für die die entsprechende Formel exakt gilt. 


Beweis. Es ist 


Dxu[f; 2] = M(h,(@) u(&))? — u2(&) M*{h,(@)) 


A 1 ® 
= u(X) | la) ulde) — =) | di hat) (da) | } 


Außerdem gilt (hy, @) = 0, wobei p + const eine beliebige Funktion aus L,(w) ist, 
für die die Quadraturformel exakt gilt. Das folgt unmittelbar aus der Definition 
der Funktionen h, und o. 


Damit ist der Satz bewiesen. 


Folgerung. Ist |d,| = |B,| = --- = |®„-ıl, so ist die Dispersion der Nähe- 
rungssumme mit einer freien Stützstelle gleich 
uk) u 1) -,5 up)? Alam) 
v 
mit 
a = S fx) yıl@) u(d) , 
wobei die y; orthonormierte Funktionen sind, für die die entsprechende Formel 
exakt gilt. 

Wir kommen nun noch einmal auf die Näherungssumme (4.4.22) zurück und 
finden dann, daß ihre Dispersion gleich dem Quadrat des Abstandes (in der 
L,([—1, +1])-Metrik gemessen) der Funktion f zum Unterraum aller ungeraden 
quadratisch integrierbaren Funktionen ist. Was die Summe (4.4.21) betrifft, so 
ist hier die Beschreibung aller Funktionen, für die die entsprechende Formel 
exakt gilt, eine kompliziertere Aufgabe. Beispielsweise gilt sie auch exakt für 
die gerade Funktion f(x) = «x? — |x| yı a. 


Ziehen wir abschließend eine Bilanz der erhaltenen Resultate, so ist folgendes 
zu bemerken. In Abschnitt 1 dieses Paragraphen wurde die Beziehung zwischen 
der Eigenschaft einer Quadraturformel mit einer freien Stützstelle, exakt für ein 
gewisses Funktionensystem {g;} zu sein, und den Abbildungen 7; festgestellt. 
Dabei geben die Abbildungen 7’; die Beziehungen zwischen den Stützstellen der 
Formel wieder. Die Resultate des Abschnitts 2 ermöglichen die Herleitung der 
umgekehrten Beziehung zwischen der Abbildung 7’ und der Eigenschaft der Qua- 
draturformel, exakt für gewisse Funktionen zu sein. Praktisch ist sowohl die 
Aufgabe, die Abbildung 7’ aus gegebenen Funktionen p; zu bestimmen, als auch 
die Aufgabe, alle Funktionen tatsächlich anzugeben, für die die Quadraturformel bei 
gegebenem 7 exakt gilt, von recht komplizierter Natur. In realen Fällen ist es 
am einfachsten, diese Verfahren zu kombinieren. Man wählt eine solche Menge 
von Gleichungen (4.4.2), daß dieses System genügend viele Lösungen hat und 
sucht darunter eine, wobei gewisse Invarianzeigenschaften ausgenutzt- werden. 
Es ist der Fall möglich, daß die exakte Gültigkeit der Quadraturformel für die 
von uns gewählten Funktionen mit einer Abbildung 7’ erreicht wird, die eine 
zyklische Gruppe der Ordnungm (m<“n) bildet. Dann verschwinden n — m 
Funktionaldeterminanten identisch. In diesem Fall muß die Quadraturformel 
m Summanden enthalten. 


$5. Andere Quadraturformeln, sukzessive Verfahren 143 


Von gewissem Interesse ist auch die Gegenüberstellung von Methoden zur Ein- 
führung des Integrals über abstrakten Maßen (Kap. I), von Quadraturformeln, 
die exakt für Haarsche Funktionen gelten, und von Quadraturformeln mit einer 
freien Stützstelle. In allen Fällen spielt bei der Betrachtung die Zerlegung der 
Ausgangsmenge & in durchschnittsfremde Teilmengen eine Rolle. Offensichtlich 
ist auch die Beziehung zwischen den Quadraturformeln mit einer freien Stützstelle 
und der Ergodentheorie. 

Weitere Beziehungen und Analogien sind leicht aufzuzeigen. Bekannt ist die 
Rolle, die in der mathematischen Statistik die bezüglich einer Gruppe invarianten 
Abbildungen spielen. Andererseits wurde die Eigenschaft der Invarianz für die 
Herleitung der klassischen Quadraturformeln benutzt (SoBoLEw [1]). Schließlich 
ist klar, daß die Integrationsverfahren mit Hilfe einer stochastischen Quadratur- 
formel mit einer freien Stützstelle als direkte Verallgemeinerung der Methode der 
symmetrischen Stichprobe zu betrachten sind. 
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Der Standpunkt, den wir bei der Untersuchung der stochastischen Quadratur- 
formeln einnehmen, unterscheidet sich vom klassischen in der Hinsicht, daß das 
grundlegende Ziel bei der Anwendung einer stochastischen Quadraturformel in 
der Dispersionsverkleinerung besteht. Die Funktionenklasse L,(z), für die die 
Formeln Anwendung finden, ist sehr umfangreich. Wie wir sehen, kann man in 
diesem Fall nicht von der Optimalität irgendeiner Quadraturformel sprechen, 
sondern die natürliche Eigenschaft einer Formel ist ihre Zulässigkeit. Wenn über 
die zu integrierende Funktion vor Beginn der Rechnung nichts bekannt ist, dann 
gibt es im allgemeinen keine andere Empfehlung als die, die zulässige Prozedur 
zu benutzen. Unter den zulässigen Prozeduren wird man dabei offensichtlich 
diejenige auswählen, die sich am einfachsten auf einer EDVA realisieren läßt. 
Ist aber der Aufwand für die Funktionswerteberechnung sehr klein, so kann man 
auf die Forderung nach der Zulässigkeit verzichten und nur die Forderung nach 
der einfachen Realisierbarkeit beibehalten, was dann zur gewöhnlichen Monte- 
Carlo-Methode führt. 

Worin besteht nun aber die eigentliche Bedeutung der Behauptung „über die 
zu integrierende Funktion ist nichts bekannt‘ ? Sie hat einen bestimmten Sinn, 
wenn die Funktionswerte als Resultat eines Experiments erhalten werden. Wird 
aber bereits ein Programm zur Funktionswerteberechnung von f(s) aufgestellt, 
dann gibt es immer zusätzliche Informationen. Den Fall, daß es Informationen 
über die Glattheit der Funktion /(®) gibt, betrachten wir nicht. Diesen Fragen 
ist eine umfangreiche Literatur gewidmet, und wir sind in $ 1 darauf eingegangen. 
Eine andere Art von Informationen führt gewöhnlich zu der Aussage, daß die 
zu integrierende Funktion einer oder einigen genügend einfach zu berechnenden 
Funktionen ähnlich ist. Diese Information kann recht gut durch eine entspre- 
chende Interpolationsquadraturformel berücksichtigt werden. Dabei wird ge- 
wöhnlich eine Formel mit einer kleinen Anzahl von Stützstellen hergeleitet, aber 
die Funktionen, für die die Formel exakt gilt, können sehr verschiedenartig sein. 
Ein solcher Standpunkt wurde auch im vorangehenden Paragraphen eingenommen. 
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Wir waren bestrebt, eine Anzahl genügend einfacher Quadraturformeln zu erhalten, 
die auf Funktionen aus L,(u) anwendbar sind. Wie schon bemerkt, ist ein solches 
Vorgehen eng mit Aufgaben der Versuchsplanung verknüpft. Ausführlicher 
kommen wir darauf auch in Kapitel V zurück. Anschließend gehen wir auf einige 
Verfahren der näherungsweisen Integration ein, die bisher in diesem Kapitel noch 
nicht betrachtet wurden. 


1. Quadraturformeln mit teilweise festen Stützstellen. Es sei /(®) € Ly(k), 
Y,(2) = const und @,(a) orthogonal zu @,(#%) und normiert. Die Quadraturformel 


= = [re dr) = mer BTTeR re) Ka) Men) (51) 


gilt exakt Für y,(®) und @,(®). Die Menge (# : 9,(@) > 0} hat offensichtlich ein 
von Null verschiedenes Maß. Wir nehmen an, daß x* e X der Punkt ist, in dem 
die Funktion @,(®) ihr Supremum erreicht, wobei u(# : @(&) = g3(#*)) = 0 gelten 
soll und f(&) in diesem Punkt definiert ist. Wir setzen &, = x*. Man sieht leicht, 
daß die der Beziehung (4.5.1) entsprechende Näherungssumme x,[/] eine erwar- 
tungstreue Schätzung des Integrals J liefert, wenn 2, = x* ist und ®, mit der 
Dichte 


1 
ur) = 7,(@*) u(®) [Y2 


in bezug auf das Maß « verteilt ist. Es ist nämlich u(®,) > 0 für 2,€ X und 
S ut) u(de) = 1. Dann gilt aber 


Malfl = ri AH _ (ga) flay) — palaı) Har*)] nice) 


(@*) — Ps(&,)] 


P(@*) u(&) 


= [ I®) u(dx) . 
x 


So haben wir eine Quadraturformel erhalten, deren eine Stützstelle fest ist und 
deren andere zufällig gewählt wird. Man kann das als eine gewisse Kombination 
der Methode der wesentlichen Stichprobe mit der Methode der Abtrennung des 
Hauptteils betrachten. Der Hauptteil von f(#) wird hier durch den Ausdruck 
fa*) @,(2) geschätzt. Die elementar durchführbare Analyse der Dispersion von 
%|f] zeigt allerdings, daß für die erfolgreiche Anwendung der hergeleiteten Formel 
eine bestimmte Glattheit der Funktionen f(®) und ,(&) in der Umgebung des. 
Supremums notwendig ist. Außerdem muß die Menge & bestimmte topologische 
Eigenschaften besitzen, damit das Integral 


Pal) [ftae) — Kar) 
f Palm) — Pa(@*) Rn 


& 
einen endlichen Wert besitzt. 
Verhältnismäßig einfach kann man auch eine Interpolationsquadraturformel 
mit n Stützstellen herleiten, wobei n — 1 Stützstellen fest sind und eine zufällig 
gewählt wird. Wir werden die entsprechenden Resultate ohne ausführliche Be- 
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weise angeben, da sie nur für spezielle Problemstellungen von Interesse sind. 
Eine ausführliche Darstellung findet man in der Arbeit von GRANXoWSKI und 
ERMAROW [2]. 


Es seien x, die stochastische Stützstelle und: =##, i=2,...,n, die festen 
Stützstellen. Wir betrachten die Interpolationsnäherungssumme fl = A(f,Q)/A(Q) 
mit Q = (&,,%#%, ..., 2%) als Schätzwert für das Integral / ,(®) f(@) u(da). Der 
Koeffizient A,(Q) = AWXQ)/A(Q) entspricht dem Funktionswert im Punkt =,, 
die übrigen Koetfisienten AFQ) = AP(Q)/A(Q) den Funktionswerten in den 
festen Punkten. Wie schon früher bezeichnet AP hier das algebraische Komple- 
ment des Elements p,(#;) der Determinante J. Wir nehmen außerdem an, daß 
x ein Gebiet D des s-dimensionalen euklidischen Raumes und u das Lebesguesche 
Maß ist. 

Mit denselben Methoden, wie wir sie bei der Untersuchung von stochastischen 
Quadraturformeln mit einer freien Stützstelle angewendet haben, kann man eine 
Formel für die Verteilungsdichte der Stützstellex, erhalten. Damit x,[/] eine 
erwartungstreue Schätzung liefert, muß x, die Verteilungsdichte 


A 


besitzen. Die Funktion w(#,) muß nichtnegativ sein, was bestimmte Einschrän- 
kungen für die Lage der festen Stützstellen nach sich zieht. Die Normierung 
von a(&#,) wird recht einfach nachgeprüft. Da A® nicht von x, abhängt, gilt 


1 
[wo da, = ap [me AQ) de, = 1 
wegen der Orthonormiertheit der Funktionen iR Analog ergibt sich dann 


Aw A 
MAF(Q) = -/7 A "ZB dr = Aw APpla,) de, = 0, 
ö E7 


Mx.„[f] = M(A a ) 
Am 
-/7 A na) ie) dee, [mie f@) da. 


D 


Am lästigsten ist hierbei die N ichtnegativitätsbedingung für die durch die Glei- 
chung (4.5.2) bestimmte Funktion «. Weil bei festen x” der Nenner des Aus- 
drucks (4.5.2) eine Konstante ist, müssen die x so gewählt werden, daß der 
Ausdruck 

Yılaı) Al, 85, ..., a) (4.5.3) 
im Gebiet D sein Vorzeichen nicht ändert. Ist g,(x) = const und sind die pi(x), 
= 2,...,n, Polynome, dann kann man leicht zeigen, daß (4.5.3) nur dann sein 
Vorzeichen in einem gewissen Gebiet nicht ändert, wenn alle x* auf dem Rand 
von D liegen. Einige hinreichende Bedingungen, unter denen das Vorzeichen von 
(4.5.3) konstant bleibt, werden in der Arbeit von GRAnowskI und ERMAKOW [2] 
angegeben. Für ein Intervall lassen sich leicht Beispiele der genannten Quadratur- 


10 Ermakow, Monte-Carlo-Methode 
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formeln angeben, die für Polynome exakt gelten. Beispielsweise ist die Formel 
+1 


F fi) de = $ 1-2 May) + 
ud, mel-iHl, 


1+ 32%, 
31 + &) 


mi 


KD + HD, 


exakt für Polynome zweiten Grades. Diese Formel wurde erstmalig von Ham- 
MERSLEY und HAannscomg [1] erhalten. 

Wir werden auch noch einige Quadraturformeln des genannten Typs im Fall 
mehrerer Veränderlicher angeben, wobei die ganze Zahl m bedeutet, daß die 
Quadraturformel für jedes Polynom vom Grade r mit r < m exakt gilt. In allen 
diesen Formeln könnten die festen Stützstellen auf dem Rand des Gebietes D 
auch anders gewählt werden. Für s= 2 und m =1 gilt beispielsweise 


+1 +1 E 
I@, y) de dy = 1m [fl yı) - (yı —)A-L, +1) 
1-1 
+ +%)A-1,-—1]; (4.5.4) 
Il+z 
ua) = IE. 


Es bereitet keine Schwierigkeiten, zu (4.5.4) analoge Formeln für eine größere 
Anzahl von Variablen herzuleiten. Die Anzahl der benötigten festen Stützstellen 
ist für m = 1 gleich s und wächst also entsprechend an. So erhalten wir beispiels- 
weise fürrs=3, m=|1 

+1 +1 +1 


4 
K®, y, 2) de dy d = IT® [2f(&,, Yı, 21) — 221 — &ı) 1; 0,0) 


-1-1—1 


+ a + WILL) + a WA-LH+L-DI, 
l+z 
5° 


ur Yo) = 


Für s = 2, m = 2 hat eine Formel mit fünf festen Stützstellen auf dem Rand des 
Quadrats die Gestalt 


+1 +1 
fiz, y) dx dy 
1-4 
1 


= 3I-&) Say) - ul - u +) At] A-L+) 

+ By —- 2) +(1+ 1-1 —1) - Si — yı) A—L 0) 

+(1+2) [1 — 32, — 2y) (+1, +1) + (1-32, + 2) (+1, —D]} 
31 -—al) 

ua) =. 
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Diese Formeln sind allerdings praktisch weniger wichtig mit Ausnahme der Fälle, 
in denen der Integrand eine besonders einfache Gestalt auf dem Rand besitzt 
(etwa gleich Null ist). 

Man kann auch das Verfahren der voneinander abhängigen Stützstellen mit 
dem Verfahren der festen Stützstellen kombinieren. So erhält man beispielsweise 
fürs = 1,m = 5 die Formel 

+1 


2 
fe da = a + MK-3)] 


3 202? — 4 
N + NED + 10), 
_ ala) 


ulz,) 4 

Quadraturformeln, bei denen Stützstellen von mehr als einer freien Stützstelle 
abhängen, haben wir nicht untersucht. Die einzige Ausnahme soll eine Formel 
mit zwei freien Stützstellen bilden 


f(@) de = zn) 4 + fa) + /a3)] - (4.5.5) 
En 


Dabei ist 2, der s-dimensionale Einheitswürfel, (<a <1l,i=|],..,s}, die 
Koordinaten der Punkte &,, &, und x, sind durch die Beziehung 


(id)? + (a2 + («WE =1, el. 
miteinander verknüpft, @, und x, werden frei gewählt, und ihre Koordinaten be- 
sitzen die gemeinsame Verteilungsdichte 


ur, 2) = = „IQ - am — y)-ır. (4.5.6) 


Das entspricht einer Gleichverteilung der Größen =, x, x(® auf einer Ein- 
heitskugelfläche. 

Die Formel gilt exakt für Konstanten und die zweiten Potenzen von x. 
Wenn man symmetrisch zum Koordinatenursprung gelegene Stützstellen heran- 
zieht, dann ergibt sich für den Würfel (-1<xM<]1l, k=]1,...,s} eine For- 
mel mit sechs Stützstellen, die für alle ersten und zweiten Potenzen von z® und 
für gewisse paarweise Produkte dieser Potenzen exakt gilt. Wir weisen darauf 
hin, daß die Anzahl der Stützstellen mit wachsendem s nicht größer wird. Die 
Dispersion der der Formel (4.5.5) entsprechenden Näherungssumme wurde von 
ERMAKOW [2] untersucht. 

Die Stützstellen der symmetrischen Quadraturformel (4.5.5) wurden als Pseudo- 
zufallszahlen bei der Berechnung des Strahlendurchgangs durch Materie mit der 
Monte-Carlo-Methode verwendet. Zu diesem Zweck wurden Werte von s zwischen 
50 und 100 gewählt. Die 65 Koordinaten der Stützstellen wurden in der Maschine 
gespeichert. Die Geschichte eines Teilchens wurde mit Hilfe von Zahlen nach- 
gespielt, die den Koordinaten einer Stützstelle entsprechen. Reichten s Zahlen 


10* 
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für die Realisierung einer Geschichte nicht aus, so wurden weiter gewöhnliche Pseu- 
dozufallszahlen benutzt. Die Mittelwerte der entsprechenden Größe von sechs 
Teilchengeschichten bilden offensichtlich eine Realisierung der Näherungssumme. 

Wenn man nebeneinander die Trajektorien von sechs Teilchen verfolgt, dann 
ist die vorherige Speicherung von Koordinaten der Stützstellen der Quadratur- 
formel nicht nötig; man kann sie auch während der Teilchenbewegung erhalten, 
und die Größe s spielt keine wesentliche Rolle. 

Die Berechnung wurde bei vorheriger Speicherung der Stützstellen durchgeführt. 
Es wurde der Durchgang von y-Quanten durch eine Platte berechnet, wenn auf 
der einen Seite ein planparalleler Teilchenstrom eintritt. 

Die Dispersion (über eine Trajektorie) der Austrittswahrscheinlichkeit der 
y-Quanten aus der Platte auf der Seite, die dem einfallenden Strom gegenüber 
liegt, wird mit 0} bezeichnet, wenn die gewöhnliche Monte-Carlo-Methode benutzt 
wird, und mit o? bei Gebrauch der Formel (4.5.5). Das Verhältnis von 0? zu 0) 
ist in der folgenden Tabelle angeführt (7 bezeichnet dabei die Dieke der Platte 
in Vielfachen der freien Weglänge): 


In den Rechnungen wurde bei der Modellierung der Verteilungen nicht die 
v.-Neumannsche Methode benutzt, da ihre Anwendung die Vielfachheit der zu 
berechnenden Integrale vergrößert. 


2. Sukzessive Verfahren. Es wäre verlockend, ein Integrationsverfahren suk- 
zessiver Art herzuleiten, in dem die in einem früheren Schritt erhaltenen Kennt- 
nisse über die Funktion zur Verbesserung des Schätzwertes benutzt würden. 
Probleme solcher Art wurden beispielsweise von MassHar [1], Harron [2] und 
Pvs# [1] untersucht. Die Idee, sukzessive Verfahren der Monte-Carlo-Methode 
für die Integralberechnung herzuleiten, hat gewisse Ähnlichkeit mit der Idee, 
bei der Methode der wesentlichen Stichproben (Kap. IV, $ 2) Bernsteinpolynome 
zu benutzen. 

Man kann die Rechnung in aufeinanderfolgende Schritte zerlegen und zugleich 
mit der Schätzung des Integrals /, = f f{®) u(dse) durch die Summe 


rn 


N 
= 7 f@:) 


im ersten Schritt die Fourierkoeffizienten 
Pr” 


— SJ@) pıl@) ale) durch = N fa) il) 


$5. Andere Quadraturformeln, sukzessive Verfahren 149 


schätzen. Dabei sind die &; unabhängig und entsprechend dem Wahrscheinlich- 
keitsmaß u verteilt, die p, € Ly(u) sind orthonormiert, 9 =1. Dann kann man 
annehmen, daß die Linearkombination 


rn 


fe) = 5 &pıl) 
j=0 


die Funktion f genügend gut approximiert. Wenn die entsprechenden Voraus- 
setzungen erfüllt sind, kann man nun f beider Anwendung der Methode der wesent- 
lichen Stichprobe oder der Methode der Abtrennung des Hauptteils benutzen. In 
diesem zweiten Schritt werden dann auch die Größen I, j= 0, ....n und außer- 
dem die Größen I,41 +. Intm m > 0, geschätzt usw. 


Mit Hilfe der Ergebnisse von Kapitel V kann der Leser ohne Schwierigkeiten. 
verschiedene Modifikationen sukzessiver Verfahren solcher Art herleiten. Im 
Zusammenhang mit diesen Verfahren stehen eine Reihe theoretischer Fragen, die 
bisher kaum untersucht wurden. Da die Anwendung dieser Verfahren die Rechen- 
programme wesentlich kompliziert und es keine einfachen Empfehlungen für ihre 
Konstruktion gibt, wurde ihre Untersuchung nur in einer sehr geringen Anzahl von 
Fällen durchgeführt. Am vollständigsten wurden theoretische Fragen dazu von 
Harrton [2] untersucht, wobei unter anderem auch folgendes Resultat erhalten 
wurde. R 

Es sei f fa. . . eine Folge erwartungstreuer Schätzungen der Größe I,. Wir 
nennen diese Schätzungen primär und stellen sekundäre Schätzungen F,, Fy,... 
nach der Regel 


Fa aufn + (1 an) fn-ı > „=l, m=1h23:..., 
auf, so daß also 
F m 2 bw, 
mit = 
bem — ay, um=a D ( -a) fr i<m, 0<sbm<I1, 
-i 
gilt. Dann erhält man den 


Satz 4.11. Existiert max b(P) — 0 und ein e > 0 derart, daß die Reihe 
i 


oo 

2 ark”® 

E=1 
konvergiert und Df, S ck” (+2) mit einer Konstanten c gilt, dann konvergiert F„ 
für m — © mit der Wahrscheinlichkeit 1 gegen Iy. 


Zu den sukzessiven Prozeduren, die in der Literatur (PucH [1]) betrachtet 
wurden, gehört auch die folgende. 

Es sei I, = f f(x) u(d&) und v(x,y) eine vom Parameter % abhängige Schar 
von Wahrscheinlichkeitsmaßen, wobei % = (Yy +. Yn);, Y€ D, einem gewissen 
Gebiet D des n-dimensionalen euklidischen Raumes angehört. Das Maß u soll 
für jedes ye D absolut stetig bezüglich » sein. 
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Dann kann die Größe I, für jedes y = y, durch die Summe (Kap. IV, $ 2) 
x N d 
Tuyı) = N Stay ah) 
iel dv, 


mit 9, = v(#,%,) geschätzt werden. Dabeisind die x} unabhängig für verschiedene ö 
und in bezug auf das Maß », verteilt. 


Die Dispersion des Schätzwertes Zu) beträgt 
N du 2 
Dis) = N | Pe) (7) vide) — 2 (4.5.7) 
0 


Man versucht nun, %, so zu wählen, daß der Ausdruck (4.5.7) minimalwird. Das 
ist gleichbedeutend mit der Minimierung von 


d 2 
yly) = if P®) (3 5) v(de) . 


Die Ermittlung eines solchen % kann mit einer Gradientenmethode erfolgen. Dazu 
wird eine Folge %,%,,... und die entsprechende Folge von Maßen », v7,» ». 
folgendermaßen bestimmt: 


h 


— dızı. 
8.1l k+1 


Yııı = Yet 


©;+] ist ein Schätzwert des Gradienten ®..;ı von y, also des Vektors mit den Kom 


ponenten 
u oy e u 
Ur +1 = | dyı 3 #005 ne) für Y= Yızı» 


h ist eine geeignet zu wählende Konstante (Schrittweite). Dabei muß man be- 
achten, daß 


Ylyın) = [re( “ 


dv. +ı 


2 d 
Jresitan) = (pe) 


u du 

— vr (dee 
T-+1 dvr »( 
gilt und die Schätzung des Gradienten y mit Stichprobenwerten & durchgeführt 
werden kann, die entsprechend dem Maß y, verteilt sind. Pvez [1] gibt in seiner 
Arbeit ein numerisches Beispiel für die Anwendung der beschriebenen Methode 


auf eine Aufgabe der Massenbedienung an. 


In Kapitel V werden wir das Problem betrachten, die Ableitungen des Erwar- 
tungswertes einer Zufallsfunktion auf Grund ihrer Stichprobenwerte in einzelnen 
Punkten zu schätzen. Die dort beschriebenen Algorithmen ermöglichen prinzipiell 
Die sukzessive Ermittlung solcher Parameter, die die Dispersion minimieren. Der 
Erfolg hängt allerdings wesentlich von der günstigen Wahl der Schar von Ver- 
teilungen ab und in vielen Fällen von der geeigneten Wahl der Anfangswerte, denn 
das Verhalten der Dispersion in Abhängigkeit von den Parametern kann sehr 
kompliziert sein. 


V. DIE APPROXIMATION DER MITTELWERTE 
VON ZUFALLSFUNKTIONEN 


$1. Gleichmäßige Approximation 


In den $$ 1 und 2 dieses Kapitels werden die Ergebnisse der Arbeiten von FRoLOw 
und Tscn&£xzow [1], [2] dargestellt. Darin wird die Approximation von Funktionen 
untersucht, deren Werte mit Hilfe der Monte Carlo-Methode berechnet werden. 
Dabei wird, wie schon in Kapitel IV, nur die Aufgabe A betrachtet, es wird also 
die Endlichkeit des zweiten Moments der entsprechenden Zufallsgrößen voraus- 
gesetzt. Die Untersuchung der Abhängigkeit eines stochastischen Modells von 
einem Parameter (oder von einer Gruppe von Parametern) ist für uns von beson- 
derem Interesse. Sehr wichtig ist es, einen Parameterwert zu finden, für den ein 
gewisser Mittelwert ein Extremum erreicht. Von Interesse kann auch die Durch- 
führung ‚vergleichender Experimente“ sein, also die Lösung der Frage, welcher 
von zwei gewählten Werten des Parameters in bezug auf ein bestimmtes Kriterium 
das bessere Ergebnis liefert. Bei der Lösung dieser Probleme ist in vielen Fällen 
ein Verfahren bequem, das in der Arbeit von FroLow und TscHExzow [1] darge- 
stellt wird und das Methode der abhängigen Versuche genannt wurde. Obwohl 
eigentlich die abhängigen Versuche auch die Grundlage einiger anderer Methoden 
sind (Quadraturformeln mit stochastischen Stützstellen können abhängige Stütz- 
stellen haben), bleiben wir bei der Bezeichnung Methode der abhängigen Versuche 
für das anschließend darzustellende Verfahren, da diese Bezeichnung bereits in die 
Literatur eingegangen ist. 

Es sei {(x, ®) eine Funktion des zufälligen Arguments » und des Parameters x. 
Wir bezeichnen dann den Erwartungswert von £ bezüglich » mit f{x) = M,„£(&, »). 
Um die Werte von f(x) über einem gewissen Intervall [a, b] der Veränderlichen x 
zu erhalten, kann man eine Reihe von Werten ©, a su <w,<"<xmuSsb, 
wählen und für diese x;-Werte das Integral 

M.E=SCta,o)Pldo), i=l.,m, 
mit der Monte-Carlo-Methode schätzen. Dabei werden wegen der statistischen 
Streuung die Werte des Integrals für verschiedene x; im allgemeinen nicht auf 
einer glatten Kurve liegen, selbst dann wenn f(x) eine glatte Funktion ist. Man 
kann verschiedene Glättungsmethoden anwenden, um eine glatte Kurve zu erhal- 
ten. Weiterhin werden wir solche Methoden ausführlich betrachten, die in der 
Regel durch die Berücksichtigung zusätzlicher Informationen über den Verlauf 
der Funktion f(®) ihre Begründung finden. Das einfachste Verfahren besteht nun 
darin, bei der Schätzung des Integrals / &(x;, ©) P(do) für verschiedene x, ein und 
dieselbe Folge von Beobachtungen &; zu benutzen. In diesem Fall wird der Graph 


N 
N 3 Co) 
je 


152 V. Die Approximation der Mittelwerte von Zufallsfunktionen 


von sogar bei einer verhältnismäßig großen statistischen Streuung der Form nach 
dem Graph von M„ö(z, ©) benachbart sein, und eine Vorstellung vom Funktions- 
verlauf von f(x) kann man mit einer kleinen Anzahl von Versuchen erhalten. 
Diese nur angedeuteten Überlegungen können auch streng begründet werden. 
Wir bezeichnen nun mit e(z, ®) die Differenz &(z, ®) = £(x, ©) — f(x) und sagen, 
daß &(&, o) € I‘, ist, wenn die Bedingungen 
|öre(z, ©) 
———S5 Ar 
FE) (5.1.1) 
und 
S [erto)P Pdo) = Cr <® (P>2) 


erfüllt sind. Dann gilt der 


ı 
Satz 5.1. Gehört die Funktion E(&,o) zu \) I also zu jedem I, k=]1, ...,1, 
k=ı 


dann konvergiert die zufällige Vektorfunktion 


A N ok 
px = YN [m Ba Be: row}, k=0,.,!—1 (5.1.2) 


gegen eine gewisse sielige zufällige Gaußsche Vektorfunktion. 


Folgerung 5.1. Sind für & die Bedingungen (5.1.1) für k= 0,1], ..., I erfüllt, 
dann hat die Abweichung des empirischen Mittelwertes 
Fre) = N! I Le, 0:) 
und seiner ersten 1 — 1 Ableitungen vom wahren Erwartungswert und seinen Ab- 
leitungen der Wahrscheinlichkeit nach eine Ordnung von L/YN. 


Beweis des Satzes. Wegen 
San BOT 
folgt aus (5.1.2) die Ungleichung Dpo® < C,< ©. Nach dem Mittelwertsatz 
erhalten wir 
PR) — Pe’) = pHr!(0) a" — a’), 
wobei 9 zwischen =’ und x’ liegt, und 
MoPR”) — PP? S 2” — «]P Crrı- 


Daraus folgt, daß für ®, k= 0, ..., 2 — 1, gleichmäßig in k das Stetigkeitskriterium 
für Trajektorien von KoLMoGoROFF (Kap. 1], $ 2) erfüllt ist. Nach Procmorow [1] 
konvergiert eine stetige zufällige Vektorfunktion py(x) schwach gegen eine stetige 
zufällige Gaußsche Vektorfunktion 9,„(2), deren Erwartungswert identisch Null 
ist und deren Korrelationsfunktion 


B,4&,&') =M {[E(@’, 0) — [O(a’)] [EN ,o) — K%Xz=’’)]} 
ist. Damit ist der Satz bewiesen. 
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Das Maximum des Betrages der Vektorfunktion ist ein stetiges Funktional auf 
den Trajektorien des Prozesses und konvergiert folglich gegen eine gewisse Grenz- 
verteilung. Wegen der Stetigkeit der Trajektorien des Grenzprozesses ist diese der 
Wahrscheinlichkeit nach beschränkt. Daraus folgt, daß die mit YN multiplizierte 
Abweichung des empirischen Mittelwertes vom theoretischen Wert der Wahr- 
scheinlichkeit nach beschränkt ist und folglich die Abweichung selbst der Wahr- 
scheinlichkeit nach wie 1//N abnimmt. Diese letzte Überlegung beweist die 
Folgerung des Satzes 5.1. Der bewiesene Satz gibt uns so die Möglichkeit, das 
unbekannte Bild der Funktion im Sinne der gleichmäßigen Konvergenz zu approxi- 
mieren (eine Abnahmeordnung von N -U/? für das Maximum der absoluten Abweich- 
ung ist gesichert). Mit der Approximation im quadratischen Mittel beschäftigen 
wir uns in $ 2. 

Wenn das Integral f f(x, y) dy zu berechnen ist, wobei D, ein (von x unabhän- 


Y 
giges) Gebiet des s-dimensionalen euklidischen Raumes ist und f(x, %) stetig diffe- 
renzierbar von & abhängt, dann bedarf der Algorithmus keiner weiteren Erläute- 
rung. Man muß für die Berechnung der Werte von f(x, 3%) bei verschiedenen x 
dieselben Zufallszahlen benutzen. 

Der Satz 5.1 bietet auch wesentliche Vorteile, wenn die Werte der Ableitung 
von f(x) zu berechnen sind. Wir wollen die Ableitung f’(x) im Punkt x, berechnen. 
Wäre die Funktion f exakt bekannt, so könnte man ein hinreichend kleines h 
wählen und (bei einer Rechnung mit der notwendigen Genauigkeit) den Wert 
von f’(x,) nach der Näherungsformel 


Pia) = Een ei) (5.1.3) 


erhalten. Wir wollen nun diese Formel anwenden, indem wir f{z, 4A) und 
fo — k) mit der Monte-Carlo-Methode durch zwei Serien w;, ®; unabhängiger 
Realisierungen der Größe » schätzen. 


N 
Ian t+h)=Nt 3 Sm + h,w:;) 
vr (5.1.4) 


is 
fo -M=N N tm hai). 


Dann wird sich der Fehler bei der Berechnung von f’(z,) aus dem Verfahrensfehler 
der Formel (5.1.3) und dem Fehler zusammensetzen, der bei der Schätzung der 
Funktionswerte mit den Formeln (5.1.4) entsteht. Für genügend kleines h kann 
man diesen Fehler also durch die Größe 


[273 YD, - 
Wo) + 3y Vonın (5.1.5) 


schätzen, wobei y das Konfidenzniveau der Schätzung ist und 


D, = SE, w) Pldw) — Pix) 
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gilt. Wenn h bei wachsendem N weniger als N 4/2 abnimmt, strebt der Ausdruck 
(5.1.5) gegen Null. Man kann die optimale Darstellung für % angeben, die den Aus- 
druck (5.1.5) zum Minimum macht: 


hope = (By)? 1 (ao)l =? [DO] (a) WR; 
das Minimum selbst ist gleich 

[21 (ao)l Dal? 2N)=N®. 
Der Fehler nimmt also wie N-U® ab. 


Bei der Anwendung der Methode der abhängigen Versuche kann man dagegen 
die Schrittweite h beliebig klein wählen (bei entsprechender Rechengenauigkeit). 
Dann entfällt der Verfahrensfehler, und der Gesamtfehler ist gleich yDI!? N-1R, 
wobei N die Anzahl der Versuche ist und 


D, = S [a @)P Pldo) — ao)?’ - 


Analoge Berechnungen kann man bei komplizierteren Approximationsverfahren 
für die Ableitung und für Ableitungen höherer Ordnung durchführen. Bei der 
Approximation der ersten Ableitung durch kompliziertere Formeln und Anwen- 
dung der gewöhnlichen Monte-Carlo-Methode kann man im allgemeinen eine Fehler- 
abnahme von höherer Ordnung als N-U® erreichen. Aber der Umfang der Rechen- 
arbeit wächst dabei wesentlich an, und man muß eine größere Glattheit der Funk- 
tion fordern. 


$2. Approximation einer unbekannten Dichte im quadratischen Mittel 


In vielen Fällen möchte man die Dichte einer Zufallsgröße approximieren, deren 
Realisierungen mit der Monte-Carlo-Methode erhalten wurden. Eine Reihe von 
Aufgaben, in denen das benötigt wird, haben wir in Kapitel III betrachtet. Ab- 
schließend werden einige Fakten angeführt, die mit der einfachsten Approximation 
einer unbekannten Dichte im Mittel verbunden sind. Die Darstellung schließt sich 
an die Arbeit von FroLow und TscHEnzow [1] an. 


Es sei £ eine Zufallsgröße und u(dx) ein Maß im Raum der Werte von &. Wir 
bezeichnen mit p(«) = dP/du die Verteilungsdichte von & in bezug auf das Maß u 
und mit 9, i =], ...,n, ein System von mit dem Gewicht r(x), r(x) > 0, ortho- 
normierten Funktionen. Wir nehmen an, daß p(x) dem Raum L,(r, u) der mit 
dem Gewicht r(x) bezüglich z quadratisch integrierbaren area angehört. 
Wenn wir über Realisierungen der Zufallsgröße € verfügen, können wir die Fourier- 
koeffizienten (9, 9:) der Funktion p bezüglich des Systems {p;} schätzen. Man 
sieht leicht, daß (9, 9) = M[g;(£) r(£)] ist, und setzt dann wie gewöhnlich 


(9) = N Elpinı (&)] = af; 
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wobei die &, unabhängige Realisierungen von & sind. Mit den Schätzungen af, 
der Fourierkoeffizienten der Funktion p(x) kann man das Polynom 


m VER 
= zZ abnpı(a) Yr(«) (8.2.1) 
= 
bilden, das als Schätzung für den Abschnitt z,,(x) der Fourierreihe von p(x) dient. 
Einige Aussagen über die Güte der Approximation von p(x) durch (x) enthält 


der 


Satz 5.2. Gegeben seien eine Folge von Gewichten r„(x) und mit den Gewichten 
Tm(x) orthonormierte Funktionensysteme {pm}! = 1, ..., m, mit 


IIp(@)lI® = S P*a) rmla) ulde) SH <o. (8.2.2) 
Dann gilt: : 
A. Aus 
II) — ame)? < Cm”? , (5.2.3) 
ms FE Wine) Tmla)]? Dia) ulda) < Cy (6.2.4) 


Jolgt mit m n®, $ = 1/(1 + y) die Ungleichung 
172 
(Inte) - as (5) nam) so, 


d.h., R(6) = ((C, + 20) 6)? mn üst eine Bereichsschätzung für die Norm 
der Differenz ||p(x) — si(z)||, die dem Konfidenzniveau 1—6d, OL<I<LT1 eni- 
spricht. 


B. Ist 
Bm” < II»(«) oz Ama)? ’ (3.2.5) 
AB, <m 52 inte) Ine)] Dia) nid) (5.2.6) 
mr 63 rimt) rm) [Pi,m(&) rm{z)P pie) ulde) < O5 , (5.2.7) 


dann gilt von einem gewissen n ab (wie auch m für alle genügend kleinen ö gewählt 
wird) für jede Bereichsschätzung 


R(6) > Bn-U-R2, 


P(IIp(z) — aA&)|| > Bn-U-M) >56, (5.2.8) 


wobei B eine geeignete Kombination der Konstanten B, und B, ist. Dabei kann die 
Bedingung (5.2.7) noch abgeschwächt werden, indem man O, durch Cym!*r ersetzt. 


Beweis. Die Differenz p(x) — xj;(x) kann in beliebiger Reihenfolge nach den 
Maßen u(dx) und P(do) integriert werden, weil sie nach diesen Maßen meßbar 
ist. Die Differenz besteht aus zwei Komponenten, einer Komponente, die durch 


156 V. Die Approximation der Mittelwerte von Zufallsfunktionen 


den Unterschied von p(x) und x„(x) hervorgerufen wird, und einer anderen, die 
durch die zufällige Abweichung der af, von a;,m = (P, 9i,m) bedingt ist. Dann 
gilt 

ae) ame) ?= S Iple) — au) rm(&) ulde) 


—/[ pe) ana] rmle) alda)-+/ ame) ke) Fmla) ade) 
= Ip) — mal? + & an an) 


weil p(x) — (x) zu jedem @;,„ orthogonal ist. 
Nach den Voraussetzungen des Satzes ist ||p(&2)— r„(x)|| von der Ordnung m’. 
Wir setzen 


m 
7° =„ (am — Ai,m) > 
i=1 


m m m 
Mi? = en Dat - ls M(ei, m(E) Ds) == 2 (Di,ms mit. 

i= i= im 
Aus den Voraussetzungen des Satzes folgt, daß der erste Summand in den ge- 
schweiften Klammern eine Größe der Ordnung m ist. Aus (5.2.2) folgt die Be- 
schränktheit des zweiten Summanden. Daher sind die Voraussetzungen (5.2.4) 
und (5.2.6) folgenden Aussagen gleichwertig: 


Mn? = M 5 (a - an? <O, —, (5.2.9) 
i-1 
m (a —_a,.a Mg 8 
2B, = ni M 2: (am — Ai,m)? < 0, = für m <zE, (5.2.10) 


Wir beweisen nun den ersten Teil des Satzes: 
Miipie) — hle)ll? = IIpte) — Amle)ll* + Mi? < Oymr +0, 
Setzt man m =1 + [n?] mit 8 = (1 + y)"!, so erhält man 
Milp(&) — an)? < (O1 + 20,)n=ItP, 


Daraus ergibt sich mit der Tschebyscheffschen Ungleichung 
2 
[In ar 2 (nel ao. 


Zum Beweis des zweiten Teiles wird zunächst My? geschätzt. Nach einigen Um- 
formungen ergibt sich 


m\2 
Mnt < nm Im?n?[0, + 40%, v3 + 603] + 3 (*) OR; 
also 


m 2 
M2 (af m — 4;,n)® (afim — am)? <O, (=) (5.2.11) 
üi=1 


mit C, = 903 + 40, YC, + C;. 
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Nun benutzen wir die Ungleichung!) 
Pi? > dMn?) > [Mn?P? [MI (L — 9°. (5.2.12) 
Wegen dieser Ungleichung ist 7? mit einer von Null verschiedenen Wahrscheinlichkeit 
von derselben Größenordnung wieMr?. Mit9 = = erhält man aus (5.2.10) und (5.2.12) 
Mn? B 
2 > > — 
et E 
Folglich gilt mit einer Wahrscheinlichkeit, die größer als .B3/C, ist, 
IIp(®) — ana)? = |Iple) — am@)l? +7? > Bm? + B, 
1 
> BB nn —L, 
wobei das Gleichheitszeichen nur für m = [y.B,n/.B,]? erreicht wird. Daher ergibt 
sich für ö6< B3/0, 
P{lIp(e) — ama)I| > Bn-Al} >60, 


also gilt für jede Bereichsschätzung, die dem Konfidenzniveau 1 — ö entspricht, 
die Beziehung R(6) > Bn-U-AR, 


Folgerung 5.2. Die Abweichung des Histogramms (Häufigkeitsdiagramm) der 
Zufallsgröße & as£sb, vom Graph der Dichte ist bei einer Klassenauswahl 
mu n\? bestenfalls der Wahrscheinlichkeit nach von der Ordnung n PX 


Beweis. Wir nehmen eine äquivalente Klasseneinteilung mit der Klassenbreite 
h = (b — a)/man. In diesem Fall ist r(«) = 1, u(de) = di, 


— für zed(i) 
Vs” ; 


sonst 


Fi, m(x) = 


mit 
di)= [le +i,a+ti+)hl, i=0,1L,.,m-1. 


j E1 Diese Ungleichung ist eine Folgerung der Ungleichung 

(S \®] dG(&))? = Sf @’ d@(e) 
für dieMomente. Essei nämlich & eine Zufallsgröße und #>0 fest. Dann erhält man mit. 

6 -| 0 für z<B8Mi, 

m (PIE > BMIEN)-T PIE >®) für z==dMIE| 
die a ini, 
oo 

(„Zara >)" = „f,*ardsı >@) us > Min. 
Die Ungleichung (5.2.12) ist eine Folgerung aus dieser letzten Ungleichung und den 
Ungleiehungen 

oo 
Sr dP(E] >2) < far ap(lE] > x) = M&, 
OMIE| ö 


oMiel 
„full @PEl >) = Misl — 5 IaldPlIEl >=) = ME] — OMISI = Mizl (1-9). 
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Die Voraussetzungen (5.2.3), (5.2.6) und (5.2.7) des Satzes sind erfüllt, wie sich 
folgendermaßen ergibt: 


b 
1 m 1 
m 2 [Yi,»(&)]? p(&) de = er 


m a1 
er la Te, 


m 


b 
1 m 1 2 1 
RR IGEG. [Pı,m(&) P(®) dı = 41 = a)? p(x) de = (b — a% 3 


Für ze d(i) ist a(®) =h! S pl) de. Setzt man die zweite Ableitung d*’p/dx? 
a(i) 


als beschränkt voraus, so ergibt sich 


b 
h? % 


b 
re — Ana)? de = % | dx + Oh?) v m?. 


Daraus folgt $# = 1/3. 
Nach dem bewiesenen Satz ist die zufällige Abweichung ||p(«) — #(x)|| von 
einer Größenordnung nicht kleiner als »-!%. Diese Schranke wird für m  n\® 
erreicht, und in anderen Fällen ist das Ergebnis nur schlechter. 
Das letzte Ergebnis besitzt ein mehrdimensionales Analogon, das wir hier ohne 
Beweis formulieren. 


Folgerung 5.3. Die Abweichung des Hisiogramms eines Zufallsvektors& — {EÜ)}, 
SEN <b,j=]T,...,s, vom Graph der Dichte ist bei äquivalenter Klassenein- 
teilung bezüglich jeder Koordinate und einer Klassenanzahl m n n"+?2 der Wahr- 
scheinlichkeit nach von der Größenordnung n\E+9), 


Folgerung 5.4. Die Funktionen g; bilden ein vollständiges System mit dem 
Gewicht r(x) orthonormierter Funktionen. Sind die Bedingungen 


IS pl) Pilz) r(@) ulde)| < Alt, >12, 
S Tpıle) r(@)P pie) ulda) <C 
erfüllt und wählt man m = n!!?*, so ist die Abweichung des Polynoms ni,(x) von 
p(x) in der Norm des L;(r, u) der Wahrscheinlichkeit nach von der Größenordnung 
nU2tllts, 
Beweis. Nach der Parsevalschen Gleichung gilt 


oo 


IP) — rm(@)ll? = 2 9% 2)? < Alu — 1) mitt, 
i=m ’ 

Dann sind die Bedingungen des Satzes 5.2 mit y = 2x — 1, C, = 4/(2x — 1) und 

0, = C erfüllt, woraus die Behauptung folgt. 


Der Satz 5.2 und seine Folgerungen ermöglichen die Darstellung der Berech- 
nungen mit der Monte-Carlo-Methode in Form einer approximativen analytischen 
Abhängigkeit. Wesentlich ist dabei, daß die numerischen Algorithmen einfach 
sind. Die Anwendung der beschriebenen Methoden erfordert einige a-priori- 
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Kenntnisse über die Glattheit der zu approximierenden Funktionen. Manchmal 
kann es vorteilhaft sein, die ursprüngliche Aufgabe in eine vielleicht sogar kompli- 
ziertere Form zu transformieren, wenn dabei die uns interessierenden Abhängig- 
keiten glatte Funktionen der Parameter werden. 

Die Schätzung der Genauigkeit bei der Berechnung der Ableitung durch unab- 
hängige Versuchsreihen und bei der Approximation der Dichte durch ihre Fourier- 
reihe stellt die Verbindung zwischen den zufälligen und systematischen Kompo- 
nenten des Verfahrensfehlers her. Zugleich ist am Beispiel der Methode der ah- 
hängigen Versuche ersichtlich, daß spezielleModellierungsmethoden zu einer wesent- 
lichen Einsparung bei der Rechenarbeit führen können. Eine analoge Erscheinung 
wurde auch bei der Berechnung von Integralen festgestellt. 


Der folgende Paragraph ist der Approximation einer Zufallsfunktion durch einen 
Abschnitt ihrer Fourierreihe in den Fällen gewidmet, in denen wir über Parameter- 
werte verfügen können, in welchen die Zufallsfunktion realisiert wird. 


$3. Interpolation mit stochastischen Stützstellen 


Die Approximationsmethode für Funktionen, die wir in diesem Paragraphen be- 
schreiben werden, gründet sich formal auf die Methode der Interpolation. Sie 
hängt eng mit der Methode der kleinsten Quadrate und mit Aufgaben der Versuchs- 
planung bei einer Regressionsanalyse zusammen. Die anschließend dargestellten 
Resultate wurden hauptsächlich in den Arbeiten von ErMakow [1], [3] und Gra- 
NOWSKI, und ERMAKOW [1] erhalten. 

Im vorigen Paragraphen haben wir für die Schätzung der Fourierkoeifizienten 
einer unbekannten Funktion die gewöhnliche Monte-Carlo-Methode benutzt. 
Jetzt wollen wir für die Schätzung der Fourierkoeffizienten Quadraturformeln mit 
stochastischen Stützstellen benutzen. Im wesentlichen löst die Einführung einer 
Funktion g, in den Integranden dieses Problem (es wurde schon mehrfach be- 
merkt, daß anstelle von , auch eine andere Funktion 9; genommen werden kann, 
für die die Quadraturformel exakt gilt). Daher könnten wir auf das vorige Kapitel 
verweisen, da die dort erzielten Ergebnisse bei der Berechnung der Fourierkoeffi- 
zienten der uns interessierenden Funktion anwendbar sind. Es gibt aber gewisse 
Besonderheiten, die für die Approximationsaufgabe charakteristisch sind und eine 
gesonderte Darstellung der betreffenden Resultate nützlich erscheinen lassen. Die 
Verbindungen zu Aufgaben der Versuchsplanung einer Regressionsanalyse ermög- 
lichen auch die Betrachtung einiger Aspekte bei der Integralberechnung, die bisher 
noch nicht untersucht wurden. 


Wie früher sei £(#, w) eine Zufallsfunktion, & € X, ® eine Zufallsgröße, »& € 2. 
Wir nehmen noch an, daß M„£(&, ©) = f(#) ist. Dann wollen wir f(a) durch eine 
Linearkombination von Funktionen , © =1,...,n unter der Voraussetzung 
approximieren, daß Realisierungen der Funktion £ für gewisse Werte des Para- 
meters & bekannt sind. Die wesentliche Voraussetzung, die wir hier machen und 
die die Aufgaben dieses Paragraphen von denen des vorigen unterscheidet, besteht 
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darin, daß wir die Parameterwerte &, für die die Berechnung (Messung) von £(®) 
durchgeführt werden soll, nach eigenem Belieben auswählen können. Das Problem 
einer in bezug auf ein gewisses Kriterium optimalen Wahl der Parameterwerte & 
ist dem Wesen nach eine Aufgabe der Versuchsplanung, wie sie auch in diesem 
Paragraphen betrachtet wird. 

Wir nehmen nun an, daß £ eine Hilbertsche Zufallsfunktion und fe La(w) ist; 
die @;(2) € Lx(u), ©= 1, ...,n seien linear unabhängig; mit {, bezeichnen wir die 
Realisierung der Funktion £ für x = &,. Dann betrachten wir folgende Interpola- 
tionsaufgabe. 

Zu bestimmen sind solche Zahlen a,, daß die Gleichungen 


N 
= GR) — & ’ j = 1: “RN, (5.3.1) 


gelten. Wir setzen nun voraus, daß die Determinante A(Q) dieses Systems un- 
gleich Null ist, so daß die a; berechnet werden können. Unter Benutzung der 
Cramerschen Regel erhalten wir die folgende bekannte Form des Interpolations- 
polynoms: 


0 Ha) +. En) 
= ee sn 
In Pılaen) Pnlden) 


Die a, selbst sind gleich 


= TI det led Tee m 

(5.3.3) 
Man sieht leicht, daß a, = x,[f] ist (in den Bezeichnungen von $ 2) und daß die 
übrigen «a, in x„[f] übergehen, wenn man dort anstelle von g, die Funktion @, 
einsetzt und die Spalten entsprechend vertauscht. Aus (5.3.2) folgt auch, daß 
wir die ,; ohne Beschränkung der Allgemeinheit als orthonormiert voraussetzen 
können, Die Bildung der gleichen Linearkombinationen von Spalten in Zähler 
und Nenner von (5.3.2) ändert die Größe f[£,@] nicht. Weil wir die Werte x, 
frei und insbesondere auch zufällig wählen können, gilt der 


Satz 5.3. Bilden die g, =], ...,n, ein orthonormiertes Funktionensystem und 
ist die Zufallsgröße Q mit der Dichte wQ) = (rn!) A%XQ) verteilt, so ist der totale 
Erwartungswert von F[£,Q] gleich der Teilsumme der Fourierreihe der Funktion f 
nach dem System {p:} 


n 

M.,aF 1; 91 = e (pi) pie) . (5.3.4) 
Nee 

Hierin bezeichnet & die Gesamtheit der Werte 1, ..., On für die Realisierungen der 
Funktion £ erhalten wurden. 


Der Beweis des Satzes folgt aus den vorhergehenden Überlegungen und aus 
Satz 4.3. 
In analoger Weise folgt aus Satz 4.4 der 
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Satz 5.4. Die Dispersion der Zufallsgröße STE, Q] genügt der Ungleichung 


Duofle, Q1< File) 1 el - Em Dal nt) + (m) tan}, 


(5.3.5) 
wobei für ein reguläres System {p;} das Gleichheitszeichen gilt. 


Der Fall, daß die Realisierungen £(&,, ©) für nur einen Wert erhalten wurden 
(der Fall abhängiger Versuche), wird von uns nicht betrachtet. Man kann zeigen, 
daß die Dispersion des Interpolationspolynoms in diesem Fall kleiner wird. 

Der beschriebene Algorithmus für die Interpolation ist also äquivalent der 
gleichzeitigen Berechnung von n Fourierkoeffizienten der Funktion f. Wir nehmen 
nun an, daß wir zur Verwirklichung des Algorithmus die Werte von @ mit der 
v.-Neumannschen Methode bestimmen. Dazu sei X ein Gebiet D des s-dimensiona- 
len Raumes mit dem Volumen 1 und u das Lebesguesche Maß. Dann besteht der 
Algorithmus in folgendem: 


1. Man wählt die im Gebiet 2 gleich verteilten Größen &,, ..., & und berech- 
net A(&,, ..., &,), indem man beispielsweise die Matrix @,(&;) in zwei Dreiecks- 
matrizen zerlegt. Wenn [4A(&,, ..., &n)| >&M ausfällt, wobei & nicht von den 
15 +. &n abhängt, und M das Maximum des Betrages der Determinante A(Q) ist, 
dann kann man &,, ..., &, als Realisierung für Q wählen. Im entgegengesetzten Fall 
muß die Rechnung mit neuen &,; und x wiederholt werden. 

2. Nachdem ein geeignetes Q gefunden wurde, werden nun die £, berechnet. 
Mit Hilfe der Zerlegung der Matrix @,(#,) in zwei Dreiecksmatrizen ist das System 


zr)a=sı, PR ERROR 
leicht zu Ten. Dabei müssen die p nicht unbedingt orthonormiert sein. Der 
Mittelwert der Linearkombination 5 a;p:(&) stellt jedenfalls eine Teilsumme der 


Fourierreihe von f nach dem Baker dar, das durch Orthonormierung der Funk- 
tionen @, entstanden ist. Eine andere interessante Besonderheit besteht darin, 
daß wegen der Struktur der Dispersion (5.3.5) leicht Hypothesen über die An- 
passung an die gesuchte Funktion geprüft werden können. Diese Behauptung soll 
ausführlicher erklärt werden. 

Im Sinne des dritten Kapitels sei ein Modell gegeben, das von dem Parameter x 
abhängt. Das soll beispielsweise das Modell des Strahlendurchgangs durch eine 
Schicht der Dicke H sein. Wir nehmen an, daß die x-Achse senkrecht auf der 
Schicht steht. Die Lage der punktförmigen Quelle auf der x-Achse ist der Para- 
meter (beschrieben durch die Koordinate x). Wir setzen O<x=<H voraus. 
Wenn uns die Wahrscheinlichkeit des Strahlenaustritts aus der Schicht beix = H 
interessiert und wir diese mit der Monte-Carlo-Methode schätzen, dann kann das 
Ergebnis der Berechnungen von N Realisierungen bei fester Lage x der Quelle 
als Realisierung einer gewissen Zufallsfunktion (y(x, ®) angesehen werden. Nun 
wollen wir die wahre Abhängigkeit f(x), die die Wahrscheinlichkeit des Strahlen- 


n 
ausgangs aus der Schicht beschreibt, durch eine Linearkombination % a,9,(%) 
i=1 


11 Ermakow, Monte-Carlo-Methode 
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’ 


der Funktionen @; approximieren (die g; Seien in diesem Fall orthonormiert). 
Nachdem wir mit dem beschriebenen Algorithmus einen Wert Q = (&s +.., &n) 
erhalten haben, berechnen wir £y(2,®), © =], ...,n, und bestimmen die Koeffi- 
zienten a;. Die Prozedur kann mehrfach durchgeführt werden (N braucht nicht 
allzu groß zu sein). Zugleich kann die Dispersion der a; geschätzt werden. Diese 
Dispersion besteht aus zwei Summanden: 


Nr Ir - DR) a) de und N For)de. 
0 I u 


Werden alle Rechnungen für ein und dieselben Q-Werte durchgeführt, aber bei- 
spielsweise mit verdoppelter Anzahl von Realisierungen für jedes @ (es wird 
Cox(z, ©) berechnet), dann verringert sich der zweite Summand auf die Hälfte. 
So ist es möglich, die Summanden zu trennen und außerdem zu bestimmen, 
um wieviel genauer die gewählte Linearkombination die uns interessierende Funk- 
tion f(x) approximiert. Bei vielen physikalischen Aufgaben, bei denen man von 
vornherein Aussagen über die interessierende Funktion machen kann, wird ein 
solches Verfahren gute Dienste leisten. 

Der Begriff der Zulässigkeit, der in Verbindung mit den Integrationsverfahren 
eingeführt wurde, kann in natürlicher Weise auch für die Verfahren der stochasti- 
schen Interpolation erklärt werden. Hier gibt es allerdings eine größere Willkür, 
weil eine Vektorgröße (die Gesamtheit der Koeffizienten a.) geschätzt wird, und 
man kann verschiedene Kriterien für die Güte der Schätzung betrachten. Auf 
eines davon gehen wir näher ein. 

Wie vorher halten wir £[£,@] fest und betrachten dann alle möglichen Ver- 
teilungsfunktionen W(Q) der Zufallsgröße @. Die Gesamtheit x = (L[8,Q], W(Q)) 
nennen wir eine Prozedur der zufälligen Interpolation, wenn 


n 


M£[,Q] = z (Fu, Nyıa) und DIE,QAI< 
Im 
ist. Die Verteilungsfunktion W(Q), für die (5.3.4) erfüllt ist, nennt man natür- 
licherweise auch einen stochastischen Versuchsplan (aus Gründen, auf die wir 
später eingehen). 2 R 

Wir werden sagen, daß x = (/[£, Q], W) in einer gegebenen Klasse von Proze- 
duren # für eine Funktionenklasse H über x dominiert (vorausgesetzt, daß /[£, Q] 


in der Klasse ? die Gestalt > a;9,(&) hat), wenn Do, < Dy,„a; für beliebige 
i-l 


Funktionen ZeH und j=|],...,n gilt, wobei wenigstens für einö={,€eH und 
einen Werte j = j, die strenge Ungleichheit gilt. x heißt zulässig in der Klasse ? 
für H, wenn es in ? für H keine über x dominierende Prozedur gibt. Bei dieser 
Definition des Zulässigkeitsbegriffes gelten Sätze, die den Sätzen 4.5 und 4.6 
analog sind (Kap. IV, $ 3). 


Satz 5.5. Ist das System {gpı} in bezug auf das Maß u regulär und bilden die 
Funktionen (pi) 2,(@)} (5 = 1, ...,.n) kein vollständiges System in Le(u), dann 
ist die Prozedur (S[f, Q], W,) für die Klasse H der Hilbertschen Zufallsfunktionen 
nicht zulässig. 
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Satz5.6. Für das System der Haarschen Funktionen ist jede Prozedur der 
stochastischen Interpolation (£[f, Q], W) für H zulässig. 


Die Beweise dieser Sätze sind analog den Beweisen der Sätze 4.5 bzw. 4.6, so daß 
wir sie nicht durchführen werden. 


Wir gehen nun auf den Zusammenhang zwischen einer stochastischen Interpola- 
tionsformel und der Methode der kleinsten Quadrate ein. Dazu benötigen wir die 
bekannte Formel von Bise£T-CAvoHv, die einen Sonderfall der Aussage von Lemma 
4.1 darstellt. Es seien nämlich 9, k = 1, ...,n, und y, 1=], ...,n, zwei Systeme 
linear unabhängiger Funktionen auf dem Träger des Maßes u. Dabei ist u ein 
auf der endlichen Punktmenge #,, ...,@y konzentriertes Maß, das gleich p,, 
i= |], ..., N, für jeden Punkt ist. Die Anwendung von Lemma 4.1 führt in diesem 
Fall zu der Gleichung 


| N N N 
z Pıyr(&:) ia = 2 m“ 3 Pi, det ||Pr(@;,)I| det Iyrlai)li - 


u=l 


n!det 


Dabei ist zu berücksichtigen, daß beim Zusammenfallen von Werten i„q=1, ...,n, 
die entsprechenden Determinanten verschwinden. Das ergibt 


n!det 


fr 
 Pıpal@) vel=. 2 Pu Pindet ||pr@i,)]| det IIpıe)l- 
i= h+use#i 


I 
Berücksichtigt man jetzt, daß die Vertauschung jeweils derselben Spalten (Zeilen) 
in den unter dem Summenzeichen stehenden Determinanten ihr Produkt nicht 
ändert, so erhält man 
n 


& Prpr(@;) yılzı) 


i=1 


I 


| 


=n! Px Pu Pin det (|pr(@i,)I| det ||yıli)ll - (5.3.6) 
12, <e<ineN 
Für ,=1,i=1,..,N, fällt die Formel (5.3.6) mit der Formel von Biner- 
CAvory für die Determinante des Produktes zweier rechteckiger Matrizen zusam- 
men. 

Anstelle eines Interpolationsverfahrens zur Approximation der Funktion f(®) 
soll jetzt die Methode der kleinsten Quadrate benutzt werden, d. h., aus den Reali- 
sierungen der Funktion &(#, ®) in N Punkten (der Einfachheit halber seien die 

‚ Realisierungen unabhängig) wird eine Approximation der Funktion f{a) in Form 
n 


n!det 


der Linearkombination 3 a;p.(®), N > n, durch die Bedingung 
1 
N n a 5 u 
Er | &emen] = min (6.3.7) 
i= g9=- 
ermittelt. Für 2, = 1 werden die a, bekanntlich (Liwsık [1]) durch die Formeln 


det |I[&; P:], [92 P:]» ++» [9-1 Pi], [Pa+1> Pi)» ++ [Pas Pilll 


— (—])e+1 
Be det 1191,94)» [Pa Pl, --» [pm Pill] 


(5.3.8) 


411* 
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mit [9, y] = E3 p(a:) y(azı) bestimmt. Unter Anwendung der Formel (5.3.6) 


erhält man dann folgendes Resultat: 
Die sich aus der Bedingung (5.3.7) ergebenden Größen «a, sind die Mittelwerte der 
Größen @,(j1> +»--> In), die den Gleichungen 


2 ld In) Pallin) = I k=le,n, 
g= 


für alle möglichen j,, ..., jn genügen. Dabei wird die Mittelbildung mit dem 
Gewicht 


- AM,» 2, 
Ari,» A — 


Pa > 4? (2, » %;,) 


h=1l in=l 
durchgeführt. Wählt man der Einfachheit halber q = 1, so ergibt sich nämlich 


Bu PD .. en A(&; Ws res %;,) Az;, ..., %,) 
u Nr Alan 2 Mn) j 


Weil nun 


ME 2 . + Ku) A = 
Aa) ha Te) 


gilt, ist damit alles gezeigt. 


Ein analoges Resultat ist auch gültig, wenn die p, # 1sind. Daraus folgt, daß 
die Sätze 5.3 und 5.4 ein unendlichdimensionales Analogon zur Methode der 
kleinsten Quadrate beschreiben. Möglich ist auch eine „zweifache Mittelung“ 
oder die Bildung eines Zufallsmodells für die Methode der kleinsten Quadrate, wenn 
. die Punkte &,, ..,2y zufällig gewählt werden. Um diesen Fall zu betrachten, 
beweisen wir zunächst ein einfaches Lemma, 


Lemma 5.1. Es gilt die Identität 


S uxtdQ) det (I[p% yılll = det ||(Pa Yr)Il (3.3.9) 


N! 
(N —n)! 
mi Q = (I: «., Er). 


Der Beweis des formulierten Lemmas folgt aus dem Lemma 4.1, wenn man 
anstelle von det ||[px, yı]|| den Ausdruck (5.3.6) einsetzt und die Integration aus- 
führt. Dabei sind die Integrale über jeden Summanden der sich ergebenden 


Summe untereinander gleich und ihre Anzahl beträgt ( . Das ergibt die in (5.3.9) 
benötigte Konstante. N 


Aus Lemma 5.1 folgt nun sofort 


Satz5.5. Wenn die a, aus der Bedingung (5.3.7) bestimmt werden, wobei die 
Pu k=|1,...,n, orthonormierte Funktionen sind, die #*,, ...,&y mit der Dichte 
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(N — nl (N 1 det |[[px, yılll in bezug auf das Maß unld@) verteilt und die £; 
unabhängige Realisierungen der Funktion € sind, dann gilt 


A. M.,g@a = (f: 90) > gmh.un; (5.3.10) 
B. D.,0u SS Ir) — & (pi) nie) u(dae) + / 0*(®) u(d) (5.3.11) 
mit 


0?(a) = S C?ar, m) P(do) — ?(x) 
C. cov (a, )=0d, ga=tr. 


Der Beweis der Behauptungen A und © verläuft völlig analog zu den Beweisen 
der Sätze 4.3 und 4.4, nur anstatt auf Lemma 4.1 muß man jetzt auf Lemma 5.1 
Bezug nehmen. Wir gehen noch auf die Behauptung B ein. Das Zeichen „<“ 
gilt in der Ungleichung unabhängig davon, ob das System {g,} regulär ist oder 
nicht. Dieser Umstand hängt mit der schon erwähnten Nichtregularität eines 
beliebigen Funktionensystems über einem diskreten Maß zusammen. Der formale 
Beweis für (5.3.11) ist nicht schwierig. Es sei wieder qg = 1, dann gilt 


_N — a {det III: @il» [$3» o:): -- > [Ps Fl}? u 2 
Bi ai f lt Ilpı Pl +, Er Pill! wen 


7 Ad: Lu ven) Alan «un in) 18 
(Non)! d a RER ea Y 2 
= pn Anl Q) Ara; nd ) ur ur (91 P) . 
1Sh<<usN r ü 
Durch Anwendung der Schwarzschen Ungleichung auf den Zähler und durch 
Kürzen erhalten wir 


N 
Da, S [ano Dur, A? (&; Li, köir 2.) —; ( 91)? 


=(h 9 -2 he) + f 0°(x) u(d), (5.3.12) 


was aber der Behauptung (5.3.11) entspricht. Für die anderen g-Werte können 
analoge Berechnungen durchgeführt werden. Es ist noch zu bemerken, daß die 
Voraussetzung der Orthonormiertheit der p; in dem selben Sinn wie in den Sätzen 
4.3 und 4.4 abgeschwächt werden kann. So ergibt sich also ein enger Zusammen- 
hang zwischen der Methode der kleinsten Quadrate und der stochastischen Inter- 
polation. Dieser Zusammenhang ist für uns weiterhin von Wichtigkeit, obgleich 
man dabei einschränken muß, daß die unmittelbare praktische Anwendung der 
Ergebnisse des Satzes 5.5 zu keiner in irgendeinem Sinn optimalen Prozedur 
führt. 


Schließlich gehen wir noch auf einen Fall ein, der von bedeutendem praktischen 
Interesse ist, der aber andererseits nicht leicht zu untersuchen ist. Wir setzen 
voraus, daß die Approximation der Funktion f(#) mit Hilfe einer nichtlinearen 
Funktion G(&, a, ..., 4) verwirklicht wird, die als genügend glatt angenommen 
wird. Zur Vereinfachung der Berechnungen setzen wirn = 2. 
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Nun wird 
Mu/f [Ele ©) — @(&, a, a5) u(de) = min (5.3.13) 
gefordert. Wenn die zweiten Ableitungen der Funktion G nach den Parametern a, 


und a, existieren und stetig sind, erhält man notwendige Bedingungen für das 
Minimum in (5.3.13) in der Form 


G 
[rate Ste anal. (& a0) = 0, 
; (5.3.14) 


f 1 (da) IN) — Ga», a)]2 (01,0) = 0 


mit f{&) = MuLla, ©). 

Gewöhnlich benutzt man zur Lösung des Systems (5.3.14) eine Modifikation 
des Newtonschen Verfahrens, die in folgendem besteht. Es ist eine gewisse 
Anfangsapproximation a!, a3 gegeben. In der Umgebung dieses Wertes wird 
der Integrand aus der ersten Gleichung von (5.3.14) in eine Reihe entwickelt. 
Durch Vernachlässigung der Glieder zweiter und höherer Ordnung ergibt sich eine 
in a, — a? lineare Gleichung 


G,_.,[?% 
{ nie) (0-8 +2 


0°G _ 0G 9G 
PR 500) EEE — —— — ° = 
1 Bi da, (f G) + da, | (Ay «| 
Hier bedeutet der Querstrich, daß die entsprechenden Funktionen an den Stellen 


a, = a4, @dy = ayzu berechnen sind. Wir machen nun die zusätzliche Voraussetzung, 
daß die Größen 


Fig B Ei 
[rt Fr (—-G) bzw. Sie 20 a, da, -0) 


klein gegenüber 


2 \" 2G 
ii ulde) () bzw. f ln) € 4 > 


sind. Führt man analoge Berechnungen für die zweite Formel von (5.3.14) durch, 
so erhält man folgende Formeln für die sukzessive Verbesserung der Parameter- 
werte a, und a: 


ad = aa) + 1 | @temd, pe) (plan, ye®) j 
= — @a-2D), la) (2-1), ya) 
a-1 ( G ’ v5 ) (Y% ne Y; ) (5.3.15) 
ad = ala-D) 4 L eied,yen) Ga, wm . 
. "7 Aa=ı [(pa=D, pad)  (f— aD, pen] 


Dabei wird 


c@ 
yg-D — m (x, aan), ate-n), G=1) — Ge, ala-D, afı-D) 
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gesetzt, und A,-ı ist die Gramsche Determinante der Funktionen y(-V(x) und 
yla-V(e). Es wird weiter vorausgesetzt, daß der Prozeß der Verbesserung der 
Parameterwerte (5.3.15) für g — oo konvergiert und a(? dabei gegen die Werte a, 
strebt, die der Gleichung (5.3.13) genügen. Dann kann man bei jedem Rechen- 
schritt die Sätze 5.3 und 5.4 für die Schätzung der Werte a{P anwenden. Dabei 
wird die Schätzung &{p als Mittelwert der Größen 
— ]ym+1 — Ga- (q— 
a = au-m | I" Slae,, ©) Es D(a,) V(,) (5.3.16) 
Ari [Em 02) - Gm) Di) 


für verschiedene Realisierungen von x, und x, bestimmt. x, und x, sind mit der 
Dichte W@-D = O(A,-ı)? verteilt, € ist eine Normierungskonstante, und es ist 


Ay = det pl Pa]? . 


Praktisch muß man die Größen 44-2) in (5.3.16) durch ihre Schätzwerte ersetzen, 
d.h., man muß bei jedem Schritt eine genügend große Anzahl von Versuchen 
machen. Die Schätzung des dabei entstehenden Fehlers ist sehr kompliziert; wir 
beschränken uns auf die Aussage ‚es sind genügend viele Versuche zu machen“. 
Das genannte Verfahren hat den Vorzug, daß eine Hypothese über die Anpassung 
an die gesuchte Funktion leicht nachgeprüft werden kann, was von großer Bedeu- 
tung ist. Man kann auch andere Verfahren zur Bestimmung guter (im Sinn von 
(5.3.13)) Werte a, und a, benutzen und im abschließenden Schritt die beschriebene 
Bildung des Zufallsmodells für die Zerlegung der Dispersion in eine zufällige und 
eine nichtzufällige Komponente anwenden, wie das früher beschrieben wurde. 

Die stochastische Interpolation ist also eine Methode zur Approximation von 
Funktionen im Mittel im Unterschied zu der Methode der abhängigen Versuche. 
Offensichtlich kann man sie auch zur Schätzung der Werte der Ableitung der 
Funktion in den Fällen benutzen, in denen es aus irgendeinem Grund unbequem 
ist, die Methode der abhängigen Versuche anzuwenden. Die bewiesenen Sätze 
enthalten die Information über die Lage der Interpolationsstützstellen, deren 
vernünftige Auswahl besonders im mehrdimensionalen Fall ein sehr schwieriges 
Problem ist. Dieses Problem ist mit klassischen Methoden nur in einer kleinen 
‘Anzahl von Fällen lösbar. Bei der praktischen Modellierung mit der Monte-Carlo- 
Methode interessiert man sich aber sehr oft für gewisse Abhängigkeiten. Dabei 
kann in vielen Fällen eine vernünftige Hypothese über die Art dieser Abhängigkeit 
aufgestellt werden. Dann ermöglicht die Methode der stochastischen Interpolation 
die Schätzung der Parameter und mit einem gewissen zusätzlichen Aufwand die 
Prüfung der Hypothese. Die Algorithmen, die mit der Verwendung der Dichte W, 
verknüpft sind, führen auf die Lösung linearer algebraischer Gleichungssysteme 
mit der gleichzeitigen Berechnung ihrer Determinanten, also auf recht einfache 
Verfahren (bei einer vernünftigen Anzahl von Parametern). Freilich ist W, keine 
genügend „gute‘“ Dichte, und es sind weitere Untersuchungen der Dichten, die 
der Bedingung der Erwartungstreue genügen, erforderlich. Vom theoretischen 
Standpunkt her ist das Problem der (in bezug auf ein gewisses Kriterium) optimalen 
Verteilungsfunktionen der Stützstellen von Quadratur- oder Interpolationsformeln 
eine Aufgabe der unendlichdimensionalen linearen Optimierung. Der Betrachtung 
dieser Problemstellung ist der folgende Paragraph gewidmet. 
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Wie bisher gebrauchen wir die Bezeichnung @ = (&,, ..., £n), m > n, und nehmen 
an, daß Q eine nach dem Gesetz W(@) verteilte Zufallsgröße ist. Um die Vertei- 
lung W hervorzuheben, verwenden wir auch die Bezeichnung Q,,. Weiterhin setzen 
wir zur Vereinfachung M = M.M,. Die Funktionen f(x) und M/[s, &, Qy] sollen 
einem linearen normierten Funktionenraum F angehören. Auf dem Träger des 
Maßes u sei eine gewisse Funktion h(#, Q,) gegeben. Wir nehmen nun an, daß 
entweder & fest ist oder h(&,@) = h(Q) nicht von. x abhängt. 

Das Problem, mit dem wir uns jetzt beschäftigen wollen, besteht in folgendem: 


Es wird eine bestimmte Verteilung U (oder alle U) aus einer gewissen Menge U 
von Verteilungen gesucht derart, daß für beliebiges fe F gilt: 


B. Mozht®, 95) = inf Mh(, Qr) . (5.4.2) 
TeU 


Mit U wird die Menge von Verteilungen aus U bezeichnet, für die (5.4.1) erfüllt ist. 


Es kann vorkommen, daß U leer ist, aber ebenso gibt es eine Reihe von Fällen, 
für die die Bern plierie Aufgabe sinnvoll ist. Wie bisher soll f[x, Z, @] eine Linear- 


kombination E3 a;p;(&) sein, wobei die p; auf dem Träger X, des Maßes u linear 


unabhängig sind, Wir nehmen an, daß 


f[a,5,Q] = zZ 148) &n (5.4.3) 
= 
mit 
N 
la) = & a'p(e) 
i=1 
gilt, wobei die {, unabhängige Realisierungen der Zufallsgröße £ für & = x, sind, 
und die Bedingungen 
fi, pl), Q] = Pl) ’ i= 1; 2, N; (3.4.4) 


erfüllt sind. Die von uns bereits betrachteten konkreten Funktionen £ [x,£, @] 
haben offensichtlich die Gestalt (5.4.3), und für sie sind die Bedingungen (5.4.4) 
erfüllt. Wir machen nun noch einige zusätzliche Voraussetzungen. Der Träger X, 
des Maßes u sei kompakt, f(@) und die p,() gehören dem Raum (x, der über %, 
stetigen Funktionen an. Folglich gilt auch o; € Ly(x). 

Wir setzen in (5.4.1) F=L,(#). Wegen M,f[x, &, Q@] = £[x, f, Q] gilt 


it I1/(e) 7= M£ilz, Ei Qullln.co en an Irie3) Eu Moufl%; f; All. 


> |If{@) — 2 (9) Pr@) lu. - 
= 
Daher wird (5.4.1) für alle U erfüllt, für die 
Mg:a: = (f, 9) füralle feCy, Ra RW (5.4.5) 
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gilt, und die Aufgabe ist zurückgeführt auf die Bestimmung aller «, mit 


Ep) LS agulAQ) — S Kae) Pl) aldae)} = 0 (5.4.6) 
und ö 
Sa, Qu) wldQ) = inf Shi, Qr) UldQ) . (5.4.7) 
IT 


Es seinun m = n und «a, nach den Formeln (5.3.3) bestimmt (Fall der Interpolation) 
Eine natürliche Forderung ist dann die absolute Stetigkeit von a, bezüglich W,. 
Für die genaue Formulierung des zugehörigen linearen Optimierungsproblems 
und des dazu dualen Problems führen wir folgende Funktionenräume ein: 

1. Den Raum W der Maße, die von beschränkter Variation und bezüglich W, 
absolut stetig sind. 


2. Den Raum (%, der Vektorfunktionen f = (f(x), -.-, /(a.)) mit der Norm 
max |f(@;)l- 
Xieko 

3. Den Raum Fr, der Funktionen g(Q), so daß A?(@) g(Q) stetig über X, ist und 
die Norm max |A?(@) g(Q)| existiert. 


ziek, 

4. Den Raum V der Vektormaße © = (v,(&); +, !n(&,)) von beschränkter 
Variation, der zu 0%, adjungiert ist. 

Es ist offensichtlich, daß Fır, zu W adjungiert ist. Wir bezeichnen nun mit A 
den Operator, der jedem fe C$, die Funktion £[x, f, @]e Fr, zuordnet, und setzen 
voraus, daß h(&#,Q)e Fır, ist. Dann besteht die Aufgabe (5.4.4), (5.4.5) in der 
Bestimmung der «, die das Funktional f h(&, Q,) u(dQ) = (h, u) unter den Neben- 
bedingung (Af, «) = (f, 'Au) = (f,v,) zu einem Minimum machen. Dabei ist ®, 
ein festes Element aus V und !A der zu A adjungierte (duale) Operator. Die dazu 
duale Aufgabe besteht in der Bestimmung einer Funktion x = ((#,), +, 7(#n)) 
€ C}, für die 


Eos) S la) Dil) nd) (5.4.8) 
= Jo 
unter der Bedingung 
Ae,m,Q0l=_ 2 g;(®) a,(,Q) < h(x,Q) (5.4.9) 
j= 


ein Supremum erreicht. Daher besteht die zu (5.4.6), (5.4.7) duale Aufgabe in 
der Bestimmung einer Funktion x, für die die Teilsumme ihrer Fourierreihe unter 
der Bedingung maximal wird, daß ihr Interpolationspolynom (in bezug auf das 
W,-Maß) für fast jede Lage der Stützstellen beschränkt ist. Sowohl die primale 
als auch die duale Aufgabe haben zulässige Lösungen (im Sinn der linearen Opti- 
mierung), d.h. Lösungen, die (5.4.6) bzw. (5.4.9) genügen. Der Satz 4.3 zeigt 
nämlich, daß W, eine zulässige Lösung der primalen Aufgabe ist. Aus Satz 4.5 
folgt die Zulässigkeit der Lösungen in einer genügend kleinen Umgebung von W,. 
Für die duale Aufgabe kann eine zulässige Lösung leicht unmittelbar angegeben 
werden, nämlich eine geeignete Linearkombination der p,(@), 7 =], ...,n. Es ist 
offensichtlich, daß bei entsprechender Wahl der Konstanten in der Linearkombina- 
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tion die Ungleichung (5.4.9) erfüllt wird, weil h(&, Q) nach unten beschränkt ist 
(fast überall dem W,-Maß nach). 


Wir zeigen nun die Existenz von Lösungen der formulierten Aufgabe. 


Der Beweis kann durch verschiedene Überlegungen begründet werden. Wir be- 
nutzen Satz 7 der Arbeit von Fax [1] mit einigen Änderungen in der Bezeichnung. 


Satz. Es seien E und F zwei lokalkonvexe topologische Vektorräume, A: BE —F sei 
eine stetige lineare Abbildung, für die A(E) in F abgeschlossen ist. K sei ein abgeschlos- 
sener konvexer Kegel in F,n,<F und v,eE*. Wir setzen nun voraus, daß &,e E und 
U, € F* mit 


Ad — merInt K, (5.4.10) 
F u, € r-Int RP, Aw-u=0 (5.4.11) 
existieren. Dann existiert das Maximum von (vy, &) unter der Bedingung für € 
AE—-meK (5.4.12) 
und das Minimum von (u, n,) unter der Bedingung für u 
uch’, !Hu—u=0, (5.4.13) 


und beide Optima sind gleich. (Hier bezeichnet KV die Polare von K und t-Int K° das 
Innere von K? bezüglich der ı (F*, F)- T'opologie.) 

In unserem Fall setzen wir E = Cr. F= Fy,. Wegen der Stetigkeit der Funk- 
tionen g,(x) auf %, ist der lineare Operator A beschränkt und daher stetig. Die Ab- 
geschlossenheit von A(E) in Fr, ist offensichtlich. Der abgeschlossene konvexe 
Kegel K in Fy, wird durch die Ungleichung 9 — n = 0 mit , = h(x, P) bestimmt, 
und (5.4.12) ergibt sich dann aus (5.4.9). Die bereits früher eingeführten Bezeich- 
nungen ®, und 7, entsprechen denen des Satzes. Man zeigt auch leicht, daß die Funk- 
tionen u, die die (nichtleere) Menge der zulässigen Lösungen der primalen Aufgabe 
bilden, zur Polare von K gehören, wenn (5.4.9) erfüllt ist. Daraus folgt: 


Satz 5.6 Sind die p(2), J =], ...,n auf X%, stetig und gehört h(®, P) als Funktion 
von P, Pe &, zu Fir, dann gibt es ein u & Fy,, für das (5.4.7) unter der Bedingung (5.4.6) 


erfüllt ist. Weiterhin existiert ein n(P) e CH, für das das Funktional (5.4.8) unter der 
Bedingung (5.4.9) sein Supremum annimmt, und es gilt 


S his, P) u(dP) ar Bf ze) pe) Alde). (5.4.14) 
j= 2 


Die Funktion %, deren Existenz bewiesen ist, heißt h-optimal. Die Approximation 
der Funktion f mit Hilfe der Methode der kleinsten Quadrate unterscheidet sich 
offensichtlieh in keiner Weise von dem betrachteten Fall, und es gilt ein analoges 
Resultat. Die Existenz einer zulässigen Lösung der primalen Aufgabe wird dabei 
durch Satz 5.5 gesichert. 

Ist £ eine Hilbertsche Zufallsfunktion, dann wählt man als Objekt für die Mini- 
mierung natürlicherweise die Größe 


ME — L[®; 65 Qul)” — M(£(x#) M£ [%; &; Qu) + MI, 5 Qu] "7: Sl, 5 Qu) 
ur M(£(e) vn Mils, & Qu) 7 M(FIx, ü, Qu] rZ Milz, L, Qu)? ° 


Wegen der Erwartungstreue (vgl. (5.4.5)) ist der erste Summand unabhängig von 
dem gewählten z, und die Aufgabe führt auf die Minimierung der Größe 


D/[x, 2, Qu] = M(£l; &, Qu] — MIT, S; Qul)* (5.4.15) 
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Wenn ein gewisses £ = {, gegeben ist, dann kann man 


h(a, Qu) = 467 Co» Qu] = MS[x, 6, Qu] 


setzen. Eine h-optimale Funktion % existiert nach Satz 5.6. Ist sie eindeutig, 
so ist das Interpolationsverfahren (f; %) zulässig im Sinne der Definition des vori- 
gen Paragraphen. Das ist klar, da eine beliebige über % dominierende Prozedur u 
auch eine A-optimale Funktion sein muß, aber diese nach Voraussetzung eindeutig 
sein soll. Wenn mehrere h-optimale Funktionen « existieren, dann bilden sie eine 
konvexe Menge, und man kann unter ihnen eine gewisse Menge h,-optimaler aus- 
wählen. Ihre Existenz ergibt sich durch sinngemäße Wiederholung des Beweises 
von Satz 5.6. Dieser Prozeß kann fortgesetzt werden, und wenn er mit der Bestim- 
mung einer einzigen Verteilungsfunktion abschließt, dann kommen wir ebenfalls 
zu einer zulässigen Prozedur. 


Jetzt gehen wir noch auf die Aufgabe der Integralberechnung ein. Die Formu- 
lierung der zugehörigen linearen Optimierungsaufgabe unterscheidet sich in diesem 
Fall nur wenig von der oben dargestellten Aufgabe. Es sei 


= In I®) pl) n(de) , AED = AA, 


A(®) 


eine Interpolationsquadraturformel, die für die Funktionen 9,7 =1, ..., n, exakt 
gilt. Die Bestimmung einer k-optimalen Verteilungsfunktion geschieht folgender- 
maßen. Es wird ein «, mit 


SQ) ü(dO) = inf FAQ) utdQ) (5.4.16) 
gesucht. Die Bedingung der Erwartungstreue lautet 
2 AxQ) Kacı) e a Ei f(®) pı(@) u(de) = 0. (8.4.17) 


Die dazu duale Aufgabe Men in der Bestimmung einer Funktion 
zQ) = (ra), +, 7(0n)) € CE; 
für die das Funktional 


[ T(®) gıl®) u(de) (5.4.18) 
unter der Bedingung 
" 4:0) 
2 10) (x) S hiQ) (5.4.19) 


sein Supremum annimmt. Alle Voraussetzungen, die in Verbindung mit einer 
Interpolationsaufgabe gemacht werden, sollen erfüllt sein. Die Existenz einer 
Lösung der formulierten primalen und dualen Aufgabe wird dann völlig analog 
wie Satz 5.6 bewiesen. Für diese Lösungen gilt eine der Beziehungen (5.4.14) 
entsprechende Gleichung 


Sh(Q) u(dQ) = S (x) gılx) u(de) . 
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Wie immer könnte man anstelle von p, eine beliebige der Funktionen 9, 7 = 2, ...,n, 
betrachten. Es bereitet auch keine Schwierigkeiten, anstelle der Interpolations- 
quadraturformeln eine umfangreichere Klasse von Quadraturformeln zu betrachten. 
Dann muß man allerdings ein geeignetes Maß bestimmen, das an die Stelle des 
Maßes W, tritt. Der Zusammenhang zwischen den kh-optimalen Verteilungsfunk- 
tionen und den zulässigen Integrationsverfahren wird analog untersucht wie im 
Fall der Interpolation. Offenbar können die Ergebnisse von Kap. IV, $ 4, in diesem 
Sinn gedeutet werden, wenn als k die Dispersionen Dx[f] für irgendwelche festen 
Funktionen / gewählt werden. Die Funktion k(@) kann mit einer bestimmten 
Funktionenklasse in Verbindung gebracht werden. Es sei beispielsweise x € [0, 1], 
Pıl@) = 1 und fi®) auf [0,1] stetig differenzierbar. Dann (vgl. Kap. IV, $1) 
gibt es für das Restglied A[f] der Quadraturformel eine exakte Abschätzung in 
der Klasse der differenzierbaren Funktionen: 


1 
anzu (1-1-27 08-0 dt, 
| v 
0 


und man kann setzen 


1 
h(Q) = f 
o 


Das entsprechende «,(Q) stellt die optimale Verteilungsfunktion der Stützstellen 
für die Klasse der differenzierbaren Funktionen dar. 

Im Unterschied zum klassischen Fall wird «, hier aus einer linearen Aufgabe 
bestimmt. Nach Meinung des Autors hat übrigens die dargestellte Theorie eine 
große Perspektive in Verbindung mit der Approximation von Zufallsfunktionen 
und der Versuchsplanung. 


| 
1-12 g ma. 


Wir erörtern nun die Frage nach einer näherungsweisen Lösung der formulierten 
linearen Optimierungsaufgabe. Aufgaben dieser Art und Methoden zu ihrer 
näherungsweisen Lösung wurden schon in der Literatur betrachtet, und es gibt 
in dieser Richtung eine Reihe von Resultaten (WERSCHIK und Temerr [1]). Wir 
wollen aber hier keine Sätze und Beweise bringen, sondern uns auf eine allgemeine 
Erörterung der Problemstellung beschränken. 


1. Ist z ein diskretes Maß, das in endlich vielen Punkten konzentriert ist, dann 
werden (5.4.6)/(5.4.7), (5.4.8)/(5.4.9) und (5.4.16)/(5.4.17), (5.4.18)/(5.4.19) endlich- 
dimensionale lineare Optimierungsaufgaben, deren Lösungsmethoden genügend 
gut ausgearbeitet sind. Es gibt universelle Programme, die eine Lösung dieser 
Aufgaben selbst bei einer sehr großen Anzahl von Veränderlichen gestattet. Der 
Fall des diskreten Maßes kann auch als Approximation des stetigen Falles ange- 
sehen werden. 

2. Eine andere Methode besteht in folgendem: Wie sehon beim Beweis von Satz 
4.5 bestimmt man gewisse „Ergänzungen“ zur Verteilungsfunktion W, derart, 
daß die Bedingung der Erwartungstreue erfüllt ist und sich der Erwartungswert 
des gewählten Kriteriums h(&, @) verkleinert. 
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Etwas ausführlicher formuliert heißt das: Es wird eine gewisse Menge beschränk- 
ter in bezug auf die Veränderlichen #,, %,, ...,.%, symmetrischer Funktionen 
(Q)s +, dm(Q) gewählt und die Funktion 


= WuQ) |1+ & Bee] 


betrachtet. Die Konstanten 5; sollen nun so bestimmt werden, daß 


a) W(Q) eine Verteilungsdichte bezüglich des Maßes 1, ist also 
Rn n 
12 bulQ)S0, 25 S vAO) Wo) unldO) = 0; 


b) / hi, Q) W(Q) a,(dQ) = min. 
Bei festen »;(Q) ist das eine Aufgabe der halbunendlichen Optimierung. 


3. Schließlich kann man die Bedingung der Erwartungstreue näherungsweise 
berücksichtigen. Zum Beispiel kann man annehmen, daß f dem endlichdimen- 
sionalen Raum aller Linearkombinationen der Funktionen y;(&), 5 = 1, ..., m, 
angehört. Wir setzen voraus, daß die y,(a) orthonormiert sind, und betrachten 
Sl, f, Q]. Weil die Werte von f in f linear eingehen, gehört f[ax, /, Q] wie auch 
die Funktion @ zu dem endlichdimensionalen Raum mit der Basis f[x, y;, Q] 
= f,[Q), j= 1, ...,m. Unter Benutzung von Lemma 4.1 zeigt man dabei leicht, 
daß die f,[Q] paarweise orthogonal mit dem Gewicht W,(@) sind. Die Bedingungen 
für die Erwartungstreue erhalten jetzt die Gestalt 


SF LIQ) W(AQ) = 5 (pp), jeheum. (3.4.20) 


Gesucht ist nun ein diskretes Maß W, für das die Gleichungen (5.4.20) gelten. 
Die Bestimmung der Punkte, in denen das Maß W konzentriert sein muß, damit 
das Funktional / k(&,@) W(dQ) sein Minimum annimmt, führt offensichtlich auf 
die Bestimmung der Extremwerte einer im allgemeinen nichtlinearen Funktion 
unter den Bedingungen (5.4.20) und der Nichtnegativitätsbedingung für W. Wenn 
speziell die Bedingungen (5.4.20) fehlen, dann ist das Funktional / k(x, @) W(dQ) 
unter der einzigen Bedingung zu minimieren, daß das Maß W in den Extrem- 
punkten nichtnegativ sein muß. 


Diese letzte Aufgabe ist auf das engste mit der in der Statistik betrachteten 
Aufgabe der Versuchsplanung verknüpft, auf die wir in $5 näher eingehen. Die 
hisher erhaltenen Resultate haben dagegen mehr eine prinzipielle Bedeutung. 
Ihre praktische Anwendung bei Berechnungen mit Hilfe der Monte-Carlo-Methode 
wird eingeschränkt, weil die der Modellierung zugrunde liegenden Verteilungs- 
funktionen recht kompliziert sind und es schwierig ist, solche Funktionen zu 
konstruieren. Zwar könnten diese Schwierigkeiten durch eine unzureichende 
Untersuchung des Problems bedingt sein. Denn offenbar kann man in konkreten 
Fällen genügend einfache, angenähert optimale Verteilungsfunktionen konstruieren. 
Werden aber die Realisierungen der Zufallsgröße & nicht auf rechnerischem, sondern 
auf experimentellem Weg erhalten, dann kann ein größerer Umfang bei den vor- 
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bereitenden Rechnungen und Untersuchungen durchaus gerechtfertigt sein. Das 
gilt besonders dann, wenn der mit der Durchführung des Experiments verbundene 
Aufwand recht groß ist. 


$5. Über Aufgaben der Versuchsplanung 


In $ 4 wurde ein Weg zur Lösung des Problems der Versuchsplanung skizziert, 
der sich etwas von den traditionellen Lösungsverfahren für diese Aufgabe unter- 
scheidet (vgl. etwa den Sammelband ‚Neue Ideen in der Versuchsplanung‘“). 
In diesem Paragraphen gehen wir kurz auf einzelne Ergebnisse auf dem Gebiet 
der Versuchsplanung ein, die unabhängig von der Monte-Carlo-Methode erhalten 
wurden, und erläutern ihre Bedeutung für die Monte-Carlo-Methode. 


Es ist wichtig, noch einmal zu unterstreichen, daß man in der überwiegenden 
Mehrzahl der Fälle die Monte-Carlo-Methode als Simulation eines gewissen realen 
Experiments auffassen kann und daß aus diesem Grund die Bearbeitung von 
experimentellen Daten und die Methoden der Versuchsplanung eine unmittelbare 
Beziehung zur Monte-Carlo-Methode haben. Wie schon bemerkt, können die 
Faktorenanalyse und die Varianzanalyse bei der Untersuchung statistischer 
Modelle realer Erscheinungen von großem Nutzen sein. Es gibt natürlich auch be- 
stimmte Besonderheiten, die für die Monte-Carlo-Methode charakteristisch sind. 
Ein reales Experiment ist in der Regel mit vielen Einschränkungen verbunden, 
die in der Natur der Sache liegen. Bei der Anwendung der Monte-Carlo-Methode 
sind solche Einschränkungen weniger wichtig, obwohl manchmal auch das Umge- 
kehrte gelten kann. So liefert in den Aufgaben des Strahlendurchgangs die Natur 
eine sehr viel umfangreichere Statistik als die Monte-Carlo-Methode. Die Anzahl 
der Teilchen, die wirklich an einem Experiment beteiligt sind, ist wesentlich größer 
als die Anzahl der Teilchen, die bei der Modellierung zu verfolgen sind. Dennoch 
hat die Monte-Carlo-Methode auch in diesem Fall bestimmte Vorzüge, da sie ohne 
weiteres eine Änderung des Modells zuläßt (ausführlicher darüber in Kap. VI). 


1. Regressionsanalyse. Wir kommen nun zu dem Problem der Planung eines 
Regressionsexperiments. Methoden, die mit starken Einschränkungen an die An- 
zahl der Experimente oder mit der Undurehführbarkeit der Experimente für ge- 
wisse Werte der Veränderlichen verbunden sind, werden von uns nicht betrachtet. 
Wir beschränken uns auf die einfachsten Aufgaben, die eine unmittelbare Bezie- 
hung zum Gegenstand dieses Buches haben. 


“Die Veränderliche &, deren Werte beliebig genau bestimmt werden können, sei 
in einem gewissen Gebiet D gegeben. Als Ergebnis eines Experiments erhält man 
Realisierungen einer Funktion &(#) = f{#) + &(#), wobei e(#) der stochastische 
Fehler ist. Wir setzen voraus, daß die für jedes & bei N Versuchen erhaltenen 
Werte &(#®) in der Gesamtheit unabhängige Zufallsgrößen sind, die nicht von & 
abhängen, also &(&) = e, wobei e mit den Parametern (0, 0?) normalverteilt ist. 
Wählen wir also gewisse Werte &,, ..., 2, € D fürj=1, ..., N, so ergeben sich 
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die Werte £(a,) = f{#;) + &5. Ist die Funktion f in dem Gebiet D exakt (oder 
bis auf einen vernachlässigbaren Fehler) in der Form 


fa) = 5 GpilX) , c; Konstanten, (5.5.1) 
i=1 


mit gegebenen Funktionen g;(&) darstellbar, so ist die Aufgabe auf die Schätzung 
der Parameter c,, i=], ...,n, zurückgeführt. Offensichtlich kann man die p;(x) 
ohne Beschränkung der Allgemeinheit als orthonormiert voraussetzen. 

Nun sei N>n. Dann benutzen wir für die Schätzung der e; die Methode der 
kleinsten Quadrate, der Schätzwert €, für c, ergibt sich also aus der Forderung 


N n 2 
& B = > Ede] — min. (8.5.2) 
je i=1 

Wir bezeichnen mit e, €, £ jeweils die Vektoren mit den Komponenten c;,, €; und 
u.» i=1,...,n, und mit ® die rechteckige Matrix ® —= ((p,(#,))). Dann ergibt 
sich aus (5.5.2) € = (ÖTÖY-1BTZ,. Diesen Ausdruck erhält man leicht unmittel- 
bar oder auch aus (5.3.8). Unter den gemachten Voraussetzungen bezüglich & . 
ist € ein normalverteilter Zufallsvektor mit dem Erwartungsvektore und der 
Kovarianzmatrix B = o?(®T®)-1 (Lissık [1]). Daher hängt die Verteilung des 
Fehlers von € von der Wahl der Punkte x; ab, und man kann die Frage nach 
ihrer optimalen Wahl stellen. Die Matrix 


A= N-19T8 — (m 5 Pilger) ie) 
K=1 


heißt Informationsmatrix. Sie ist mit der Matrix B durch Beziehung B = N0?4- 
verknüpft. Es ist bemerkenswert, daß die in $4 betrachtete Verteilungsdiehte 
für die Interpolationsstellen, die nach der Methode der kleinsten Quadrate er- 
halten wurde, bis auf eine Konstante mit der Determinante der Informations- 
matrix übereinstimmt. Einem maximalen Wert dieser Determinante entspricht 
offensichtlich ein minimaler Wert der Determinante der Kovarianzmatrix. Diese 
letzte Größe heißt auch verallgemeinerte Dispersion, und sie ist gleich dem Vo- 
lumen des Streuungsellipoids der Parameterschätzung. 


Die am häufigsten gebrauchten Kriterien für die optimale Auswahl der Punkte &, 
bestehen in folgendem: 

1. Man wählt die &,; so, daß die verallgemeinerte Dispersion der Schätzung 
mmimal wird. Eine Menge solcher (nicht notwendig verschiedener) Punkte, die 
dieser Forderung genügen, heißt D-optimaler Plan. Diese Aufgabenstellung ent- 
spricht dem allgemeinen Schema in $ 4, wenn man dort die Forderung nach der 
Erwartungstreue wegläßt und k = det A"! setzt. Das Fehlen von Bedingungen 
für die Erwartungstreue steht im Einklang mit der Voraussetzung, daß f ein 
Element des endlichdimensionalen, durch die 9, aufgespannten Unterraumes ist. 

2. Pläne, die die Länge der größten Achse des Streuungsellipsoids (größter 
Eigenwert der Kovarianzmatrix) oder die Summe der Längen aller Ellipsoidachsen 
(Spur der Kovarianzmatrix) minimieren, heißen E-optimal bzw. A-optimal. 
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I n 
3. Setzen wir f= 5 6;p,(#), dann gilt für jedes x 
i=1 


Df(«) = 5 Degilae) +2 5 corv (0,05) Pilx) Pe) = dNIpTA-ıp 
i=1 i<j 


mit gT = (Pl®), +, Pul&)). Ist D das Gebiet, in dem das Experiment durchge- 
führt wird, also &,€ D, und wird $(&,, ..., x) = eup Df(x) gesetzt, dann heißt 


der 8(#,, ...,y) minimierende Plan @-optimal. De aufeigälilten Optimalitäts- 
kriterien gehören zu den in der mathematischen Statistik meist verbreiteten 
und untersuchten, obwohl viele Situationen, die bei der Durchführung eines 
konkreten Experiments auftreten, die Formulierung eines individuellen Optimali- 
tätskriteriums erfordern. 

Die Voraussetzung, daß f(x) als Linearkombination gegebener Funktionen 9;, 
i=]1,...,n, darstellbar ist, ist bei weitem nicht immer gerechtfertigt. In $4 
sind wir voh allgemeineren Voraussetzungen ausgegangen. Eine Aufgabe, die der 
allgemeinen Aufgabe von $ 3 ähnlich ist, wurde von Box und Drarer [l] be- 
trachtet. Als Optimalitätskriterium wählten sie das Integral 


MIE@) — Mein)? am. (5.5.3) 


Daraus ergeben sich dann konkrete Empfehlungen für entsprechende Versuchs- 
pläne. Die Forderung der Erwartungstreue wird dabei nicht betrachtet. Wenn 
die Größe 

af MIE(®) — Mia)? de , 


die mittlere Dispersion von{(x) bekannt ist, dann ist das Kriterium (5.5.3) gerecht- 
fertigt. 

Da die Betrachtung von Problemen der Versuchsplanung nicht unsere Haupt- 
aufgabe ist, beschränken wir uns auf die aufgezählten Optimalitätskriterien. 
Ausführlichere Informationen sind in der umfangreichen Spezialliteratur enthalten, 
z.B. Fınsey [1], Box und DrArer [1], Kıprer [1], Scharasewskı [1] und im 
Sammelband ‚Neue Ideen in der Versuchsplanung‘“. Für uns war es wichtig, 
daß die nun darzustellenden Ideen der Dispersionsverkleinerung in der Monte- 
Carlo-Methode auf bekannte Aufgabenstellungen der Versuchsplanung führen, wo- 
bei manchmal sogar von etwas allgemeineren Problemen ausgegangen wird. 


Im Zusammenhang mit den D-optimalen Plänen wurde von Kısrer [1] der 
Begriff des stetigen Planes eingeführt. Wie schon gesagt, können bei der An- 
wendung der Methode der kleinsten Quadrate als Approximationsverfahren im 
FallN > n einige Punkte x, zusammenfallen, was der wiederholten Beobachtung 
in ein und demselben Punkt entspricht. Wir werden nur die verschiedenen 
Punkte &;, aus der Menge aller Punkte &, betrachten und jeden durch die Anzahl 
der Beobachtungen m; oder die Häufigkeit m;,/N = p, kennzeichnen. So können 
wir jedem x e D einen gewissen Wert p(a) (der auch Null sein kann) zuordnen 
und finden damit einen stetigen Plan, der durch ein bestimmtes Wahrscheinlich- 
keitsmaß auf D dargestellt wird. Solche stetigen Pläne wurden beispielsweise in 
den oben genannten Arbeiten untersucht. Der hier skizzierte Lösungsweg ist 
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zwar dem in $4 ähnlich, er unterscheidet sich aber dadurch, daß in $3 die ge- 
meinsame Verteilung der &, betrachtet wurde. 


Wir erörtern nun die Anwendung der D-optimalen Pläne in der Monte-Carlo- 
Methode. j 

Die Werte £(&) können Ergebnisse sein, die beim Lösen einer Aufgabe mit der 
Monte-Carlo-Methode erhalten wurden, und es möge 


M£(@) = f(x) =2 Pl) (5.5.4) 


gelten. Wir setzen voraus, daß £(#) für jedes x durch eine unabhängige Serie von 
Versuchen geschätzt wird. Wenn genügend viele solcher Versuche durchgeführt 
werden, dann ist der Fehler e(x) = &(x) — f(@) normalverteilt, und e(®) und e(x#’) 
sind für & == x’ unabhängig. Die Größe De(x) kann man als unabhängig von x 
annehmen, wenn bei den Berechnungen in entsprechender Weise die Anzahl der 
Versuche für jedes & gewählt wird. Das Problem führt so auf die oben formulierte 
Aufgabe, und die Anwendung eines D-optimalen Planes ist gerechtfertigt. 

Speziell seien x e [—1, +1] und p;(&) = P;_ı(x) die normierten Legendreschen 
Polynome vom Grad ?— 1, i=1,..,n. Dann ist die Aufgabe, einen D-opti- 
malen Plan für N#nk bei ganzzahligem k > 0 herzuleiten, noch völlig ungelöst 
(die allgemeinsten Resultate in dieser Richtung erhielt ScuaLAasEwsKı [1]). 
Vollständig werden wir hier den Fall N = nk untersuchen. Bei der Anwendung 
der Monte-Carlo-Methode fällt diese Voraussetzung nicht ins Gewicht. 

Es gilt nun folgendes Resultat: Der D-optimale Plan ist in a» Punkten konzen- 
triert, die Anzahlen der Wiederholungen des Versuchs in jedem Punkt sind unter- 
einander gleich, also gleich k. Die Lage der Punkte x,, %, ..., %„, in denen der 
D-optimale Plan konzentriert ist, ist folgende: x, = — 1, 2, = +1, die übrigen 
sind die Nullstellen der Ableitung des Legendreschen Polynoms vom Grad n — 1. 

Gehört also die Funktion /(z) zum endlichdimensionalen Raum der Polynome 
von Grad n — 1, so führt die Methode der kleinsten Quadrate zur Interpolation 
und für N = kn ist der Plan D-optimal. Die Interpolationsstellen müssen dazu 
in der oben genannten speziellen Weise gewählt werden. Es gibt ähnliche Er- 
gebnisse, die den Fall betreffen, daß f in der Form 


n 


fe) = re) Pi-ıl) , ra) >0, 


i= 
darstellbar ist, wobei die P;_ı(&) mit dem Gewicht r?(x) orthogonale Polynome 
sind. Diese Ergebnisse (wie auch die für r(x)=1) kann man unter der Voraus- 
setzung N = kn aus einer elektrostatischen Interpretation der Nullstellen von 
Orthogonalpolynomen erhalten (vgl. etwa Szeeö [1]). 

1. 722) = (1 — aJett (1 + art, well, +1], ,6>— 1. Der D-optimale 
Plan ist in den Nullstellen des Jacobischen Polynoms Pi} mit den Parametern q 
und £ konzentriert. 

2. r?(&) = e”*, x € [0, oo). Der optimale Plan ist in den Nullstellen des Poly- 
noms xL%’(«) konzentriert. Dabei ist L/P(x) das Laguerresche Polynom mit 
dem Parameter q vom Grad n. 


12 Ermakow, Monte-Carlo-Methode 
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3. r2(2) = aItle-2, ze [0, oo), g>— 1. Der optimale Plan ist in den Null- 
stellen des Polynoms Li? ‚(x) konzentriert. 


4. r2(x) = e=*, ze (—0, oo). Der D-optimale Plan ist in den Nullstellen des 
Hermiteschen Polynoms H,„., vom Grad n + 1 konzentriert. Im Fall einer trigo- 
nometrischen Folge führt die Forderung der D-Optimalität zu äquidistanten 
Interpolationsstellen. Der mehrdimensionale Fall ist wie gewöhnlich wesentlich 
komplizierter, aber einzelne Ergebnisse, die sich auf eine spezielle Gestalt der 
Funktion f beziehen, kann man in der Literatur finden. 

Sehr oft werden wegen der Schwierigkeit des Problems im mehrdimensionalen 
Fall zusätzliche Voraussetzungen über die Anordnung der Punkte des Planes 
gemacht. So kann man zusätzlich die Invarianz des Planes gegenüber gewissen 
Transformationen der Veränderlichen fordern, z. B. gegenüber Drehung des Ko- 
ordinatensystems (Drehungsinvarianz, vgl. auch Kap. IV,$ 4). Dabei wird voraus- 
gesetzt, daß das Gebiet D eine bestimmte Zentralsymmetrie besitzt und daß der 
Koordinatenursprung im Zentrum von Dliegt. Diese zusätzlichen Voraussetzungen 
vereinfachen die Gestalt der Kovarianzmatrix und folglich auch die Maximierung 
ihrer Determinante. 


Ausführlicher gehen wir auf den Fall ein, daß f(x) eine Linearkombination der 
Legendreschen ‚Polynome ist: 


n+1 n-+1 e 
fe) = 2 Pie) = datt. 
Bei der Schätzung der Koeffizienten d;, ergibt sich für N=n, daß |4| gleich 
dem Quadrat der Vandermondeschen Determinante ist. Man sieht leicht, daß 
außerdem 
14| = IT Pı(«;) 
j-1 


gilt, wobei P, ein Polynom mit den Nullstellen x;, ..., x, und dem höchsten Koeffi- 
zienten 1 ist. Die Größe von max | 4] in Abhängigkeit von » ist bekannt (ScHur [1]) 


92.33....n®.22.98.... — Y)n-2 
M„= Frage 4l= -— - 3. 5 EI 2 == a m ‚M=4. 
(5.5.5) 
Dem D-optimalen Plan entsprechen folgende Werte x,,i—=1, ...,n fürn =1, ..., 6): 
n=]: aa=Htl; 
n= 2: &s=+]1 %=0; 
n.—= 8: za=+] 23 = + 1/y5; 
n—= 4: a; = +1 24 = + 37; 2 = 0; 
n=D: te =H+l 22,845 = + Yu + 2 yımı3; 


n=6: %7= + 1, x2,3,5,6 = Eu / (15 Eu 2 y15)/35, ud. 
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Anhand eines einfachen Beispiels wollen wir uns nun noch von dem Vorteil 
des D-optimalen Planes überzeugen, wenn es also Aussagen über die Gestalt der 
Funktion f(x) gibt. Es sei beispielsweise f(x) = ac + b und D=[—1, +1] das Ge- 
biet, in dem das Experiment durchgeführt wird. Wir setzen N = 10 und führen 
im ersten Fall gemäß dem D-optimalen Plan jeweils fünf Messungen von £ in 
den Punkten +1 und —I durch. Im zweiten Fall wird je eine Messung in. den 
äquidistant gelegenen Punkten +1/9, +3/9, +5/9, +7/9, +1 durchgeführt. 
Man sieht leicht, daß in beiden Fällen cov (4, b) — (0 ist, dagegen ist im ersten 
Fall Da = Db = 0/10 und im zweiten Fall Da = 2702/110 = 0,2450? und 
Di = 02/10. Bei Anwendung der Monte-Carlo-Methode im zweiten Fall muß man 
also die Anzahl der Versuche um das 1,7-fache vergrößern, damit der gleiche 
maximale Fehler der Funktion ax + b auf [—1, +1] erreicht wird wie beim opti- 
malen Plan. Man kann leicht Beispiele einer noch weniger sinnvollen Lage der 
Punkte finden, besonders im mehrdimensionalen Fall. 

Auf diese Weise können die Methoden der Versuchsplanung ein nützliches Hilfs- 
mittel sein, um die Effektivität der Monte-Carlo-Methode zu erhöhen. 


2. Methode der stochastischen Approximation. Diese Methode wurde zuerst in 
der Arbeit von RoßegIns und Monko [1] formuliert und hat unmittelbare Beziehung 
zur Problematik der Versuchsplanung und dem Gegenstand dieses Kapitels. Im 
Unterschied zu den von uns betrachteten Aufgaben der Versuchsplanung hat das 
Verfahren der stochastischen Approximation sukzessiven Charakter. Es wird 
zweckmäßigerweise benutzt, um Kenntnisse lokaler Art über den Erwartungswert 
einer Zufallsfunktion zu erhalten. 


Es sei £(&) eine Zufallsfunktion, deren Realisierungen in bestimmten festen 
Punkten als Ergebnis eines Experiments erhalten werden, und (ae) = M£(s#). 
Wenn man /{#) mit Hilfe der bereits dargelegten Methoden approximiert, kann 
man daraus Aussagen über dieLage der Extremwerte von f(#) oder Aussagen über 
die Lösungen der Gleichung f(x) = a mit gegebenem «a erhalten. Ein solches 
Herangehen ist allerdings in numerischer Hinsicht nicht immer effektiv, und 
außerdem kann man erwarten, daß die Bestimmung einer lokalen Eigenschaft 
der Funktion f(x) vielleicht weniger Experimente erfordert als die Approximation 
von f{@) im ganzen Gebiet D. Eine Lösung dieser Aufgabe über die lokalen 
Eigenschaften von f{&) kann unter bestimmten Bedingungen mit der Methode der 
stochastischen Approximation erhalten werden. Darauf gehen wir im weiteren 
kurz ein. 


Jedem Wert z, — © < x< ©, entspricht eine Zufallsgröße &(x) mit der Ver- 
teilungsfunktion F(y; x) = P(d(e) < y), also f(x) = [ ydF(y; x). 

Wir wollen nun eine Lösung 9 der Gleichung f(x) = a durch Meßwerte der 
Zufallsgröße £(#,) unter der Bedingung schätzen, daß wir die Größen x; (die Meß- 
stellen) geeignet auswählen können. Zur Lösung dieser Aufgabe wird eine Folge 
von Zufallsgrößen x, k=1,2,..., folgenderweise konstruiert: 


+ yılllze) — a) . (5.5.6) 
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Dabei ist x, willkürlich gewählt, und die y, bilden eine bestimmte Zahlenfolge 
mit den Eigenschaften 


oo co 
Zyı=@, Yyiı<m. (3.5.7) 
k-1 k=1 


Für genügend großes k kann x; als Schätzung für 0 dienen. 

Das Verfahren zur Bestimmung der x; hat also sukzessiven Charakter und ist 
dem Wesen nach eine Methode der Versuchsplanung mit dem Ziel, 9 durch Reali- 
sierungen der Zufallsgröße &(x) zu bestimmen. Für die y, kann man offensichtlich 


die Folge yı = z wählen. Die Bedingungen für die Konvergenz der Folge x; 


gegen den Grenzwert 9 im Mittel und mit der Wahrscheinlichkeit 1 bestehen in 
folgendem (Brum [1], DvorerzKy [1]): 

1. Für alle x und bestimmte feste A und B gilt |f(«)| s Alz! + B. 

2. Me) — IP <<. 

3. inf |f{z) — a| > 0 für alle emit 1/e > ec — | > e und beliebiges &, 0 <e<l. 

GLADYSCHEW [1] ersetzt die Bedingung 2 durch die Bedingung 

2’. M(&(@) — K&))? Ss All + x?) für alle x, die weniger einschränkend als die Be- 
dingung 2 ist. 

Ein analoges Verfahren kann man auch im mehrdimensionalen Fall konstruieren. 
Dazu sdien Ll& + %)s + Sol) Zufallsgrößen und Fila, --»%) = 
ME (& 5 ».-, &) die entsprechenden Erwartungswerte. Wir verwenden die Schreib- 
weise @ = (%, +. 2), Ya) = (&1(®), »., 6(2)), @ = (Ay, ..., a,) und wollen dann die 
Lösung © = (9,, ..., 9,) des Gleichungssystems 

Fılzay +) = 0; a PER IR 


schätzen. Das vektorielle Analogon der Gleichung (5.5.6) wird definiert durch 
das mehrdimensionale Verfahren von RoBBINs-Monko: 
Ir;+1 = %r 4 yıly (2%r) — a), k=1;2;+;. (5.5.8) 

Dabei ist x ein willkürlicher Vektor und {vn} eine Zahlenfolge, die die Bedin- 
gungen (5.5.7) erfüllt. 

Die hinreichenden Bedingungen dafür, daß die Norm der Differenz #; — © 
im Mittel und mit der Wahrscheinlichkeit 1 gegen Null konvergiert, entsprechen 
den oben aufgezählten und bilden den Inhalt des folgenden Satzes. 


Satz 5.7. 

1. Für alle x und geeignete Konstanten A und B gilt |\f(®)|| < Alla|| + B mit 
Ik - (®)s «., fs(&)) und einer Vektornorm |||; 

2. für 1je S Ne— O|>s 0<e<]l, gilt inf (e — 9, fix) — a) > 0, wobei 

(a,b) das Skalarprodukt der Vektoren @ und b bezeichnet; 

3. es gilt Mlly@e) — Soll? <<. 

Dann gilt . 
ji lim a, = i' —=1 und lim Mae, — O1? = 0. 

k>x 


ko 
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JoHN, BERKHOLDER und Sacks (siehe Sacks [1]) haben die asymptotische Ver- 
teilung des Prozesses der stochastischen Approximation untersucht. Unter Be- 
nutzung des Grenzwertsatzes für Martingale bewies Sacks folgende Behauptung 
(es wird nur der eindimensionale Fall betrachtet). 

Satz 5.8. Es seien folgende Vorausseizungen erfüllt: 

1. «9 (ie) —a)<0; 

2. für alle x und mit geeigneter Konstante A gilt 

Ya) —al< Ale — 9] und inf |f{®) — al > 0 
mith se —-9<st, 0<un<tw< om; 

3. a) = + le — dB) + ölx, d) mit öl, 9) = Ol|e — 9) 
für dB und a <0; 

4. sup M(&(&) — f&))? < oo , lim M(£(®) — f(@))? = ?< 0; 

x zo>ö 

5. lim lim sup _f E&a)dF<o 


R>® .>0 |r—dl<e je) > R 
mil &(x) = &(®) — f(x), wobei F die Verteilungsfunktion der Zufallsgröße &(x) ist; 
A 
6. = 7 mit 24a, >1. 
Dann gilt mit 0°? = A*’2a,A — 1)7!8? für k— oo 


u 


1 
e-Uil2o® lt. 
[03 V DB 


x 


P(ku2a — 9) < u) 


Die Bedingung 5 dieses Satzes ist insbesondere dann erfüllt, wenn die Größen 
&(&) für verschiedene x unabhängig und identisch verteilt sind oder wenn die 
Bedingung 

sup Mj&:(e)|?+" <c< oo 
für |® — 0] < $ mit gewissem r > 0, $ > 0 erfüllt ist. 

Dvorerz£ky [1] betrachtet für das Verfahren von RoBBINs-Monrko auch die 
Aufgabe, eine solche Folge {y,} zu wählen, die die Größe M(&; — Ö)? nach einer 
bestimmten Anzahl von Beobachtungen minimiert. Die von ihm gefundenen Er- 
gebnisse sind Inhalt des folgenden Satzes. 


Satz 5.9. Für die Zufallsgröße &(x), die Funktion f{x) und den Anfangswert x, 
sind folgende Bedingungen erfüllt: 
Ma) - Fa? Sor<w, 
0<ms(fa) -— a) -PI<SM<mw, 
und 
1. 02 = Mia, — 9)? < 20®/m(M — im). 
Dann folgt aus 
2. Ya = mo?(o? + m?v?k)-! 
die Aussage 
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3. M(arrı — PS v?orla? + m?v®k)”t. 
und die Wahl der Konstanten y, ist optimal in dem Sinne, daß bei Nichterfüllung 
von 2 ein der Bedingung 1 genügender Prozeß existiert, für den die Aussage 3 nicht 
gi. ; 

Eine Abschätzung der Konvergenzgeschwindigkeit für die Folge x; des Ver- 
fahrens von RoßBIns-Monxxo enthält der folgende Satz. 


Satz 5.10. Sind die Voraussetzungen 
l. fa)>a für x<Pd, fe)<a für >; 
2. ale — dl < |fia) — al < ce — PB] für alle x mit geeignetem c, und c,; 
3. Mi@) — E@))? << 00; 
4. 9, = Ak! mit einer Konstanten A 
erfüllt, dann gelten die Abschätzungen 


O(k-240) für 2A,<1l, 
Mlar+ı — 9)? = J0(k7}) für 2Ao,>]1, 
O(k=! log k) für 2A,=1. 


Diese Abschätzungen bestätigen, daß unter bestimmten Bedingungen die Be- 
nutzung der Methode der stochastischen Approximation in bezug auf den Rechen- 
aufwand günstiger sein kann als die Verfahren, die auf einer Approximation der 
ganzen Funktion f(x) beruhen. 

Ein in vieler Beziehung ähnliches Verfahren wurde von KIEFER und WOLFOWITZ 
[1] zur Bestimmung der Extremwerte einer Regressionsfunktion vorgeschlagen. 
Ist &(&) = &&,, ..., 2,) eine Zufallsgröße, wird f(@) = M£(&) gesetzt und ist O = 
= (9; ..., d,) ein Extrempunkt von f(&), dann wird das Verfahren von KIErER- 
Worrowırz zur Bestimmung des Extremwertes durch die Gleichung 


24 = % + (Ye, Yu) — Ylzı, — Yr)) (5.5.9) 
k . 

definiert. Dabei ist 

= (ad, x), y(z, a) = (C(® + ae), ....S(@ + ae,)), 
und e, ist ein Einheitsvektor, dessen i-te Komponente gleich 1 ist. Die Folgen 
der Konstanten ß, und y, müssen den Bedingungen 

oo x 2 

Eh=%x, lIimya=0, % (&) <o0 

k=1 k>o k=1 \Yk 

genügen. Bedingungen für die Konvergenz der Folge (5.5.9) gegen den Extrem- 
punkt © werden auch von Wire [1] angegeben. Wir gehen darauf aber nicht ein. 
Sowohl das Verfahren von RoBBIns-Monko wie auch das Verfahren von KIEFER- 
Worrowırz können nämlich als Spezialfälle eines allgemeineren von DvoRETZKY 


[1] hergeleiteten Verfahrens betrachtet werden. Von ihm wurde folgender Satz 
bewiesen. 


Satz 5.11. Voraussetzungen : 
1. Bulris ++, Pe)» Yaltıs +, 7x) Seien nichtnegative meßbare Funktionen von rj, +, Tr; 
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2. Baltis ++, 7x) gleichmäßig beschränkt und lim ß,—=0 gleichmäßig für beliebige r;; 
k>oo 


oo 
3. NY Yr gleichmäßig beschränkt und gleichmäßig konvergent in rı5 
k=1 
4. für alle L>Ö gibt es nichtnegative Funktionen Öy(rjs ».., 7.) mit 
oo 
I Örltı u 1) = 0 
k=1 
gleichmäßig für alle r, mit sup |r;| < L; 
5. es gibt eine reelle Zahl B und meßbare Abbildungen T, mit 


Zul: +, 72) — 9] S max (Br (1+y) Ir dl — Ör) 
für alle reellen r;; 


6. x, und yı sind Zufallsgrößen mit Ma} < ©, = My; < oo und M(yr[&5 ».., %e) = 0, 
wober 


%+1 = Tl; .... xx) + Yr> kei2,.;; " (5.5.10) 
ist. 
Dann gilt 
lim Mia; — 9)? = 0 und P| lim x, = 2 —a u 
ko k>co 


Die Ergebnisse dieses Satzes werden in der Arbeit von KIEFER und WoLrowırz 
[1] bei der Anwendung auf Extremwertaufgaben ausführlich diskutiert. 

Die Methode der stochastischen Approximation kann ein wichtiges Hilfsmittel 
bei der Optimierung der Parameter eines Modells sein. In dieser Beziehung ist 
eine vor kurzem erschienene Untersuchung von WAISBORD und Jupıx [1] von 
bedeutendem Interesse, in der ein Markoffscher Prozeß zur Ermittlung des glo- 
balen Extremums einer Funktion hergeleitet wird. Ein interessantes Beispiel für 
die Verbindung der Monte-Carlo-Methode mit der Methode der stochastischen 
Approximation wird von BoTscHEk [1] angegeben. Er benutzt diese Methoden 
im Zusammenhang mit Variationsmethoden zur Lösung von Funktionalglei- 
chungen. Auch aus diesem Beispiel kann man auf gewisse Vorzüge der Methode 
der stochastischen Approximation schließen. 


Die Funktionen f{@) und 9,(#), ..., 9n() seien Elemente des L,(z#) mit einem 
Wahrscheinlichkeitsmaß z. Wir betrachten die Gleichung 

Lu=f, (5.5.11) 

in der Z ein linearer Operator ist und die p; zu seinem Definitionsbereich gehören. 

Es wird vorausgesetzt, daß (5.5.11) eine eindeutige Lösung BORN: Wir wollen 

eine Näherungslösung dieser Gleichung in der Gestalt 4, = & c:p:(2) suchen. 


Die c; können aus einer Minimumbedingung für ein gewisses Fanktional bestimmt 
werden. Ein solches Funktional kann beispielsweise / [Lu„ — fl? u(d&) sein (Me- 
thode der kleinsten Quadrate). Setzt man y,(®) = Lo;, so erhält man zur Bestim- 
mung der c; ein lineares algebraisches Gleichungssystem 


er (Y Y;) 4 = (is ) Pr ıi= 1 ER We (5.5.12) 
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Wir führen nun die Bezeichnungen € = (c,, ..., 6) und P=(p (x), ..., Y„(x)) ein. 
Die Skalarprodukte (w,, y,) und (w;, f) bedeuten dann Erwartungswerte der Zu- 
fallsgrößen lo) y;(w) und w;(w) f(o), wobei die Verteilung der Zufallsgröße 
durch das Maß # bestimmt wird. Entsprechend der Methode der stochastischen 
Approximation für die Bestimmung der Lösungen des Gleichungssystems (5.5.8) 
konvergiert die Folge von Zufallsvektoren 


h a? 
= + on) - Ehen) | wien (5.5.13) 
J= 

im Mittel und mit der Wahrscheinlichkeit 1 gegen eine Lösung des Systems 
(5.5.12). Dabei sind die m, unabhängige Realisierungen von ». Ist Ah > 1 (2 ist 
der betragskleinste Eigenwert der Matrix des Systems (5.5.12)), dann ergibt sich 
die Konvergenzordnung 1/k. Das Rechenverfahren ist sehr einfach und erfordert 
nur geringen Speicherbedarf der EDVA. (Es ist nicht notwendig, die Matrix des 
Systems zu speichern.) 

Anstelle der Produkte y;(®) y;(w) und y,(®) f{») kann offensichtlich jede kom- 
pliziertere erwartungstreue Schätzung der Größen (7) und (y:, f) genommen 
werden. Dieser Umstand macht es möglich, eine große Anzahl zufälliger Kompo- 
nenten des Iterationsverfahrens (5.5.13) wegzulassen. Es besteht kein prinzipielles 
Hindernis, analoge Verfahren zur Lösung einer umfangreichen Klasse nicht- 
linearer Gleichungen mit Hilfe von Variationsmethoden zu benutzen. Dem Autor 
sind allerdings keine experimentellen Erfahrungen bekannt, auf deren Grundlage 
er bestimmte Empfehlungen in dieser Richtung geben könnte. 


VI. MARKOFFSCHE KETTEN UND DAMIT 
ZUSAMMENHÄNGENDE PROBLEME 


| $1. Markofische Ketten mit endlich vielen Zuständen 


Die Modellierung einer Kette mit endlich vielen Zuständen führt dem Wesen 
nach auf die Modellierung diskreter Zufallsgrößen. Das Modellierungsverfahren 
hat folgende Form: {, ?}- bezeichnet eine homogene Markoffsche Kette mit 
n Zuständen; dabei ist = = (m, ...,7%.) die Wahrscheinlichkeitsverteilung des 
Anfangszustandes und ?= ((p;,;)) die Übergangsmatrix (stochastische Matrix). 
Für die Elemente der Matrix # gilt die Beziehung 


n 
Zmum]1.: w=l1l,.,2, Pd; 
j-1 


weil jede Zeile mit der Nummer i für sich eine Wahrscheinlichkeitsverteilung dar- 
stellt. Ein Objekt, das sich in n Zuständen befinden kann und das durch eine 
Markoffsche Kette beschrieben wird, wird gewöhnlich zu diskreten Zeitpunkten 
betrachtet. Mit der Modellierung der Verteilung erhält man den Zustand im 
Anfangsmoment. Wenn sich danach das Objekt in einem Zustand mit dem In- 
dex i befindet, so wird die i-te Zeile der Matrix ? gewählt und die Verteilung 
| ınodelliert, die dieser Zeile entspricht. Auf diese Weise erhält man eine Folge 
| von Zuständen, die eine Trajektorie der gegebenen Markoffschen Kette bilden. 
Die Verallgemeinerung dieses Modellierungsverfahrens auf den Fall einer nicht- 
homogenen Markoffschen Kette, wenn also die Elemente der Matrix ? von der 
| Zeit abhängen, bereitet keine Schwierigkeiten, obwohl die unmittelbare Reali- 
sierung eines mit einer nichthomogenen Kette verbundenen Modells auf einer 
EDVA für großes » manchmal schwierig sein kann. 
Die Modellierung einer Markoffschen Kette ist in natürlicher Weise mit der 
Lösung einer großen Zahl angewandter Aufgaben verbunden. Anschließend gehen 
wir auf einige davon näher ein. 


1. Lösung eines linearen algebraischen Gleiehungssystems. Bei der Darstellung 
eines Lösungsverfahrens für ein lineares algebraisches Gleichungssystem mit der 
Monte-Carlo-Methode folgen wir im wesentlichen dem zuerst von J. von NEUMANN 
und ULAam vorgeschlagenen Weg (FORSYTHE und LEiIBLeEr [1)). 

Das lineare algebraische Gleichungssystem ist in der Gestalt 


= Ar+f (6.1.1) 


gegeben. Dabei ist € = (&%,, -.-,%n) der Spaltenvektor der Unbekannten, f = 
= (fj,...,/n) der Vektor der rechten Seiten und A= ((a,;)) die Matrix des 
Systems. 


SE 


186 VI. Markoffsche Ketten und damit zusammenhängende Probleme 


Wir setzen voraus, daß der betragsgrößte Eigenwert von A kleiner als 1 ist, 
so daß die Methode der sukzessiven Approximation 


ar = Art) 4 f (6.1.2) 
konvergiert. Wir setzen nun und auch im folgenden &'9 — f. Dann gilt 

am = (AAN. +A+HT, (6.1.3) 
und die exakte Lösung X des Systems hat die Gestalt 

X=lim(E +4A+.+4AN)f=- (E— A)Tf. 


k-> co 

Wir ordnen nun dem System (6.1.1) eine Markoffsche Kette (nicht unbedingt 
a mit » Zuständen zu. Die Anfangsverteilung x und die Übergangs- 
matrix P, (k Index des Zeitpunktes) müssen gewisse zusätzliche Voraussetzungen 
erfüllen, die mit dem System (6.1.1) verknüpft sind und die wir im weiteren for- 
mulieren. Wir wollen nun das Skalarprodukt (Rh, &) mit einem gegebenen Vektor h 
berechnen. Es ist klar, daß die Berechnung einer Komponente von & einen Sonder- 
fall dieser Aufgabe darstellt. Berechnet man gleichzeitig eine gewisse Anzahl von 
m Skalarprodukten (h,&), j=|1,...., m, so erhält man damit bei entsprechender 
Wahl von m und Rh, auch die Lösung ® des Systems. Wir verbinden nun mit dem 
System (6.1.1) und age rat h eine bestimmte Markofische Kette Ir, P;}; 


= (Ay esta) Pr (( 2) )), mit 
n MR) m 
Zmu=l, m20, Zmjml. mMiz0, t=l.sn; k=l2,. 
i=1 je1 
für die folgende Bedingungen erfüllt sind: 
1, um>0, falls h,>0; 
2, Pe >0, falls a} >0, wjeh.,n 


Wir setzen 


ae er VE (6.1.4) 
1) für u=0, 0) für 2) — 0 r 


Nun wird eine natürliche Zahl N vorgegeben und eine Trajektorie der Markoffschen 
Kette von der Länge N betrachtet. Das durch die Markoffsche Kette beschriebene 
Objekt werden wir weiterhin oft ein Teilchen nennen und annehmen, daß dieses 
Teilchen seinen Zustand entsprechend der Trajektorie ändert (sich bewegt). Dem 
sich bewegenden Teilchen wird ein „Gewicht“ Q, zugeordnet, das sich während 
der Bewegung längs der Trajektorie u in in folgender Weise ändert. 
Am Anfang, wenn sich das Teilchen im Zustand i, befindet, hat es das Gewicht 
Q, = 4, beim Übergang vom Zustand i, in den Zustand i, wird sein Gewicht 
gleich Q@, = gig: ;, usw., allgemein also 


% = di, ’ Om = Am-1lim-, im ® (6.1.5) 
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Wir führen nun eine Zufallsgröße £y ein, die auf den Trajektorien der Mar- 
koffschen Kette von der Länge N definiert ist: 


ir= z Omlim : (6.1.6) 


m= 


Jeder Trajektorie der LängeN entspricht eine Wahrscheinlichkeit 7, Pi," Pix_ı. is- 
Damit ergibt sich der Erwartungswert von &y zu 


n n 
Mr= 5: en Er, Pinis""" Pix, ir 
n N N 
 L 7uPisi" Pin Z nlinis" Iim-1, infim - 
o=1 ir-=l m=0 
Setzt man anstelle von gj, und 4,„_1,i„ die entsprechenden Werte aus (6.1.4) 
ein und ändert die Summationsreihenfolge, so ergibt sich 


N N 
ME > eo} PIE 5 E hit“ * Ai, imfirn 2 


m=0i,=l Peeie 


Nach der Definition des Matrizenprodukts gilt 
= ((a;,:,)) (@i,.,)) = (( zZ ai, «&i.)) 


n n 
— ( BE 37 2; Gi" Aim-ı, .) . 
u=1l n-ı=l 


Daraus folgt unmittelbar 


ME, = (n, Bi am). 


m=0 


und 


Für N — oo strebt also M&y gegen (h, €). Damit haben wir ein mögliches Ver- 
fahren der Monte-Carlo-Methode kennengelernt, das mit linearen algebraischen 
Gleichungssystemen verknüpft ist und das in der Berechnung von Mittelwerten 
einer Zufallsgröße &x über die Trajektorien der Markoffschen Kette besteht. 

Es folgen nun noch einige Bemerkungen, die sich auf das angegebene Verfahren 
beziehen. 


1. Bekanntlich ist (h, €) = (€*, f), wobei &* die Lösung der Gleichung 
*—= At ıh (6.1.7) 


mit der zu A transponierten Matrix AT ist. Diese Gleichung kann man übrigens 
leicht unmittelbar verifizieren. Stellt man A und f durch &* und & aus den Glei- 
chungen (6.1.1) bzw. (6.1.7) dar, so ergibt sich (@* — ATx*, x) = (c*, x — Az), 
was zu der Beziehung (AT&*, €) = (x*, Ar) äquivalent ist. Daraus folgt, daß 
man bei der Berechnung des Skalarprodukts (Rh, &) von der Gleichung 2* = ATg* 
+ h ausgehen kann. 

Die Markoffschen Ketten, die den beiden Gleichungen (6.1.1) und (6.1.7) ent- 
sprechen, können zusammenfallen, wenn für beide gleichzeitig die Bedingungen 
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(6.1.4) erfüllt sind. Das mit der Gleichung (6.1.7) verknüpfte (adjungierte) Ver- 
fahren ist bequemer, wenn man gleichzeitig mehrere Skalarprodukte (A,, X), 
j=|],...,m, berechnen muß. In diesem Fall bleibt die Markoffsche Kette für 
alle j gleich, und es ändert sich nur die Zufallsgröße &,, so daß die Schätzung 
ihres Erwartungswertes auf ein und derselben Trajektorie möglich ist. 


2. Zur Berechnung der Lösung des Systems (6.1.1) genügt es, » Vektoren für 
die A, zu wählen, bei denen die j-te Komponente gleich Eins und die übrigen 
gleich Null sind. 

Bekanntlich kann man die r-te Spalte der Matrix (E — A)-! als Lösung des 
Systems @= Ax® + h, erhalten, wenn h, der r-te Einheitsvektor ist (Spalten- 
vektor mit r-ter Komponente 1, sonst 0). Daher liefert das mit der Gleichung 
(6.1.1) verknüpfte Verfahren für = h, und h = h, als Erwartungswert von &x 
das Element in der r-ten Spalte und j-ten Zeile der Matrix (? — A)! und das 
mit der Gleichung (6.1.7) verknüpfte Verfahren das Element in der r-ten Zeile 
und j-ten Spalte derselben Matrix. Die Differenz M&yıı — M£y beträgt (h, AY+1f) 
für das erste und v2 (ATYN+1R) für das zweite Verfahren. Eine Schätzung dieser 
Skalarprodukte kann benutzt werden bei der Bestimmung der Eigenwerte der 
Matrix A, bei der Berechnung der Koeffizienten des charakteristischen Polynoms 
usw., jeweils entsprechend den bekannten numerischen Verfahren der linearen 
Algebra (Fanppesew und FADDEJEWA [1]). Die Schätzung der dabei auftretenden 
stochastischen Fehler erfordert aber zusätzliche Untersuchungen. 


3. Aus der Gleichung lim M&, = (h, x) folgt, daß die Schätzung von &y für 
N->oo 


eine Trajektorie unendlicher Länge erwartungstreu ist. In der Tat folgt aus der 


oo 
Konvergenz (Konvergenz bezüglich einer gewissen Norm) der Reihe 3% 4A”, 
N=0 
A® — E, daß von einem gewissen N = N, ab der Beitrag der bei Vergrößerung 
von N auftretenden zusätzlichen Summanden zu M£,, vernachlässigbar klein 
wird. Praktisch kann die Stelle N, der Trajektorie, an der die Berechnung abge- 
brochen werden sollte, für jede Trajektorie eine andere sein. Man erhält diese 
Stelle durch eine Schätzung des Beitrages der noch folgenden Glieder in der Reihe 
(6.1.3). Dabei ist aber eine gewisse Sorgfalt notwendig. 

Gilt für wenigstens ein Paar i, j die Beziehung «;,; = 0 und damit auch g;,; = 0, 
so wird das Gewicht des Teilchens nach dem Übergang aus den i-ten Zustand in 
den j-ten Zustand gleich Null. Offensichtlich sind dann auch alle Beiträge bei 
den nachfolgenden Übergängen gleich Null (das folgt aus (6.1.5)). Ein solcher 
Übergang hat keinen Sinn. Man kann annehmen, daß das Teilchen beim Über- 
gang vom i-ten Zustand in den j-ten Zustand „absorbiert“ wird und damit seine 
Trajektorie abbricht. In diesem Fall ist ein künstlicher Abbruch der Trajektorie 
nicht nötig. 

So kann man prinzipiell die Lösung eines linearen algebraischen Gleichungs- 
systems finden, indem man über das durch die Markoffsche Kette bestimmte Maß 
integriert. Wir kommen damit zu der von uns früher betrachteten Aufgabe der 
Integralberechnung. Dabei entspricht die Wahl verschiedener Markoffscher Ketten 
den verschiedenen Varianten der Methode der wesentlichen Stichprobe. Gleich- 
zeitig kann man unter Berücksichtigung der speziellen Struktur des mit der Mar- 
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koffschen Kette verknüpften Maßes auch gewisse spezielle Resultate über die 
Dispersion der Schätzung erhalten. Im wesentlichen werden wir diese Resultate 
unter allgemeineren Bedingungen bei der Untersuchung von Integralgleichungen 
in $2 erhalten, und nur eines dieser Resultate, das in unmittelbarer Beziehung 
zum Lösungsverfahren für lineare algebraische Gleichungssysteme steht, werden 
wir anschließend anführen. 


Zuvor gehen wir noch kurz darauf ein, wann man die Monte-Carlo-Methode 
zur Lösung von Aufgaben der linearen Algebra anwendet. Praktisch kann die 
Monte-Carlo-Methode in der beschriebenen Form mit den klassischen Lösungs- 
verfahren unter folgenden Bedingungen konkurrieren: 

1. Die Ordnung n der Matrix ist sehr groß, ihre Elemente können einfach be- 
rechnet werden, und man will die Lösung des Systems oder die Elemente der 
Kehrmatrix mit nur geringer Genauigkeit schätzen. Die Größe von rn hängt prak- 
tisch von den Eigenschaften der Rechenanlage ab, auf der die Aufgabe gelöst 
wird. Für die heutigen Anlagen muß man n = 10% bis n = 10? als genügend groß 
ansehen. 

2. Die Anwendung der Monte-Carlo-Methode ist besonders günstig, wenn nur 
eines oder eine kleine Anzahl von Skalarprodukten (A, &) mit einer geringen Zahl 
von geltenden Ziffern geschätzt werden soll, da es hierfür nicht nötig ist, vorher 
die Lösung ® zu berechnen. Als Beispiel für ein Gleichungssystem, für welches 
die Anwendung der Monte-Carlo-Methode besonders einfach ist, dient das der 
Poissonschen Gleichung entsprechende System von Differenzengleichungen. Dieses 
Beispiel wird in der Literatur über die Monte-Carlo-Methode recht oft betrachtet 
(z.B. BustLex&o u.a. [1], BusLEnKo und SCHREIDER [1]), und auch wir gehen 
darauf kurz ein, um dann die oben gestellten Fragen zu klären. 


Wir betrachten einen sehr einfachen Fall der ersten Randwertaufgabe für die 
Gleichung 


ou ou 
— as Han Ar 
62? U ey? f&, Y) (6 1.8) 


im Einheitsquadrat. Ohne Beschränkung der Allgemeinheit können wir annehmen, 
daß die Randbedingung in der Form ulr = 0 gegeben ist, wobei /’ der Rand 


Abb. 6.1 
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des Quadrates ist. Wir unterteilen das Quadrat durch ein Netz mit der Maschen- 
weite 7 = 1/L (Abb. 6.1). Wenn man die partiellen Ableitungen in Gleichung (6.1.8) 
näherungsweise durch die zweiten dividierten Differenzen ersetzt und die Rand- 
bedingung berücksichtigt, dann erhält man ein System von (L — 1)? linearen 
algebraischen Gleichungen der Form 


wg Wit Bizwig-ı + swing + Arzt — Piss (6.1.9) 
wobei ;,; ein Näherungswert für vu im Punkt (sl, jl) des Netzes ist, und weiterhin 
gilt: j 

os fie für il 14 für j+l 
ku=ld hd, au=|o für 1, u={0 für j-1, 


 _ fl für i4b-1 .._ fl für je+2-1 
Wo für i=L-1, ge 
(6.1.10) 


In den Fällen, in denen die Koeffizienten Null sind, ist es eigentlich gleichgültig 
zu welchen Unbekannten sie gehören. Man kann annehmen, daß sie zu einer 
gewissen fiktiven Unbekannten v gehören, die den Randpunkten des Netzes ent- 
spricht. Bei einer durchgehenden Numerietung der Unbekannten nach der Regel 
%=Ww; mit k=j+(L—-1)(@— 1) erhält die Matrix A die in Tabelle 6.1, 
dargestellte Gestalt. Der Matrix A entspricht in natürlicher Weise die stochasti- 
sche Matrix von Tabelle 6.2. Die Größen g;; sind in diesem Fall gleich Eins 
(außer im Fall des Übergangs in den Zustand 10, wo sie Null sind). Die Kon- 
struktion des Vektors h hängt davon ab, welche Größen wir als Ergebnis der 
Rechnung erhalten wollen. 


Unbekannte 


Gleichung 


4 
5 
6 
2 
8 


9 


WW | 
Tabelle 6.1. Gestalt der Matrix 4 (L = 4) 
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Unbekannte 


Gleichung a = IIEEBER Ar zer 
ıl2|s Js |s|e | | 8 | o | 1m 
1 | ua | 1/4 | od | | 2 © 
2 1/4 ı1ya lu | 1/4 
3 E= | | 1/4 | | ır 
4 1/4 | | | 1/4 ya | 1/4 
5 1/4 1/4 1/4 1/e | 0 
6 | 1/4 1/4 ı ya] 174 
7 | | 1/4 1/4 | 1/2 
8 | 1/4 1/4 Iya| ı74 
9 | | 1/4 1/4 | 1/2 
Dr I 4 


Tabelle 6.2. Gestalt der Matrix P 


Durch Anwendung des adjungierten Verfahrens zur Lösung des Systems (6.6.1) 
und durch Wahl eines Vektors, dessen Komponenten alle gleich 1/(Z — 1)? 
sind, gelangen wir zu folgendem Algorithmus. Das Teilchen entsteht gleichwahr- 
scheinlich in einem beliebigen inneren Punkt des Netzes und geht gleichwahr- 
scheinlich in einen beliebigen Nachbarpunkt über. Beim Übergang in einen Rand- 
punkt bricht die Trajektorie ab. Für dieses Lösungsverfahren benötigt man 
(L — 1)? Speicherplätze. Wenn das Teilchen im k,-ten Punkt entsteht, wird bei 
Erreichen des k-ten Punktes (der Anfangspunkt zählt dazu) im k-ten Speicher- 
platz die Größe 2?f,, hinzugefügt. Man verfolgt nun M unabhängige Trajektorien 
des Teilchens. Der Mittelwert über die Trajektorien vom Inhalt eines jeden 
Speicherplatzes ist ein Schätzwert für die entsprechende Komponente des Lösungs- 
vektors. 

Dieses einfache Verfahren wurde hier absichtlich von einem allgemeineren 
Standpunkt und daher in etwas komplizierter Weise dargestellt. Der Leser kann 
jetzt ohne besondere Schwierigkeit Lösungsverfahren für Differenzengleichungen 
betrachten, die anderen Aufgaben für partielle Differentialgleichungen entspre- 
chen. Im allgemeinen Fall braucht das Teilchen freilich nicht in den Nachbar- 
punkt des Gitters überzugehen, die Gewichte werden hierbei nach der allgemeinen 
Formel (6.1.5) berechnet und können ihr Vorzeichen bei einem Übergang ändern. 

Aus den Darlegungen folgt, daß bei der Aufstellung eines Lösungsverfahrens 
mit Hilfe der Monte-Carlo-Methode eine bedeutende Willkür bleibt. Wir gehen 
insbesondere von der willkürlichen Wahl der Markoffschen Kette (x, #) aus. Es 
ist klar, daß man diese Kette für die Schätzung der uns interessierenden Größen 
in ungünstiger Weise wählen kann. Wenn uns etwa die k,-te Komponente x;, 
der Lösung interessiert, aber die Wahrscheinlichkeit des Übergangs in den Zu- 
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stand k, sehr klein gewählt wird, dann wird das Teilchen diesen k,-ten Punkt 
selten erreichen. Andererseits kann der Beitrag zum Gewicht des Teilchens (das 
in das Ergebnis eingeht) beim Erreichen des k,-ten Punktes sehr groß sein. Das 
hängt davon ab, ob die Dispersion Di; der Schätzung von x;, groß ist. Über- 
legungen solcher Art können bei der Auswahl der Kette (x, ?) nützlich sein. 

Hat man die Lösung eines linearen algebraischen Gleichungssystems im Auge, 
so können noch folgende Resultate von Nutzen sein. Wir setzen voraus, daß die 
Matrix A des Systems 


z= Ax®+f (6.1.11) 


symmetrisch ist. Das bedeutet keine wesentliche Einschränkung, da man (we- 
nigstens theoretisch) jedes System mit unsymmetrischer Matrix leicht in ein 
äquivalentes System mit symmetrischer Matrix überführen kann. 

Nach dem direkten Verfahren kann man die Lösung erhalten, indem man dem 
System (6.1.11) » Markoffsche Ketten (=, #), j=1, ...,n, zuordnet, wobei ; 
der j-te Einheitsvektor ist und nicht von j abhängt. Wie bereits gezeigt wurde, 
ist es dabei vorteilhaft, bei der Schätzung jeder Unbekannten nicht unabhängige 
Trajektorien zu benutzen, sondern stets ein und dieselbe. Dazu nimmt man an, 
daß das Teilchen im i-ten Zustand entstanden ist, falls es während seiner Irrfahrt 
einmal in diesen Zustand übergeht. Das ist möglich wegen der speziellen Gestalt 
der Anfangsverteilungen ,;. 

Wenn bei dem üblichen Rechenverfahren Eu den Schätzwert der i-ten Kom- 
ponente X; der exakten Lösung über eine Trajektorie der Länge N bezeichnet, 
dann gilt die Beziehung 


Re PP 
2) ee, (6.1.12) 


N 
i,7 


falls der letzte Schritt der Trajektorie ein Übergang vom j-ten in den i-ten Zu- 
stand ist. Wir setzen 


&0 — lim EI i 


N>o 


Dann gilt das folgende Lemma. 


Lemma 6.1. Ist die Norm der Matrix ((a} ;'p:,;)) kleiner als Eins, dann sind 
die Dispersionen DEV, i=1,...,n, endlich und genügen der Gleichung 


DE zii ai (DEO +: — Eu #. (6.1.13) 


j=1Pi,j 


Beweis. Es gilt 


DEU — ME)? — #2 = lim M(&$r — 


No 
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und wegen (6.1.12) 
sa 18 
DE — — lim In 3% Ne Bi u iE M Bw n u a 


No 


= fi + 2; 23 a:,j% F Pe as MED)? — 
= Pi, 
Die Richtigkeit von (6.1.13) folgt aus dieser letzten Gleichung und aus (6.1.11). 
Es ist nun leicht zu sehen, daß mit der formalen Schreibweise 
x Ar; 
Pump; = Mi ur 

2 Q,r%% = 

k=1 


(6.1.14) 


die rechte Seite der Gleichung (6.1.13) verschwindet. Daraus folgt 


Satz 6.1. Ist die durch Gleichung (6.1.14) definierte Matrix P* = ((p}})) eine 
stochastische Matrix, die die Bedingungen (6.1.4) (die P* mit A in Beziehung setzen) 
erfüllt, und die Norm der Matrix R = ((r;,;)) mit 

Rn 
” 2 TER up; &ı — fi) 


a = Bea, .1.15 
N; 3 &, (6 ) 


kleiner als Eins, so gilt 

DEO — 0 für i=1L.,n. 
Güt weiterhin für alle i 
ı.f& 
8 
dann ist &9 = x, auf allen Trajektorien der Kette. . 


Die Bedingung (6.1.16) ist offensichtlich erfüllt, wenn alle fi und a;,; positiv 
sind 


1; (6.1.16) 


Beweis. Die erste Aussage des Satzes ist offensichtlich richtig. Wir setzen 
nun 5; —=1-— a,fw,. Dann gilt wegen (6.1.6) und (6.1.14) die Beziehung 


E60) = u H Fin fi Iim—1 
p=zı 7 —lmnt 
"lm 


k=0 I\m=1 


N N 
u: ( u L &1)) kesce Zu sg s): 
k=0 


m=1 
Daraus folgt auch die zweite Aussage des Satzes. 


Mit diesem Resultat kann man insbesondere a-priori-Kenntnisse über die Lö- 


sung für eine Dispersionsverkleinerung des Schätzwertes & berücksichtigen. In 
einer Arbeit [2] benutzt HaLTox dieses Resultat zur Herleitung eines sukzessiven 
Lösungsverfahrens für lineare algebraische Gleichungssysteme. 


13 Ermakow, Monte-Carlo-Methode 
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2. Stationäre Verteilungen Markoffscher Ketten. Zunächst ist es zweckmäßig, 
an einige Definitionen zu erinnern, die sich auf die Struktur einer Markoffschen 
Kette beziehen. 

Man sagt, daß der Zustand y, vom Zustand y; aus erreichbar ist, (ein echter 
Nachfolger von y; ist), wenn eine Zahl m > 0 derart existiert, daß die Wahr- 
scheinlichkeit eines Übergangs von y, zu y; in m Schritten positiv ist. Eine Menge 
von Zuständen & = (yi, +» Yu)» $ Z m, heißt abgeschlossen, wenn von keinem zu 
€ gehörenden Zustand aus ein nicht zu € gehörender Zustand erreicht werden 
kann. Bildet ein einzelner Zustand eine abgeschlossene Menge, so heißt er ein 
absorbierender Zustand. Hat beispielsweise die Übergangsmatrix ? die Gestalt 


Pı,ı 0 ) 

| 0 Pa2 
mit quadratischen stochastischen Matrizen ?,,ı und 3,5, dann sind die der Ma- 
trix Pı,ı entsprechenden Zustände nicht erreichbar von den Zuständen, die 
Ps,2 entsprechen und umgekehrt. Eine Kette mit solchen Matrizen kann offen- 
sichtlich nur in dem Fall zur Lösung eines linearen algebraischen Gleichungs- 
systems benutzt werden, in dem das System in zwei unabhängige Gleichungs- 
systeme der entsprechenden Ordnung zerfällt. 

Eine Kette heißt irreduzibel, wenn es in ihr außer der Menge aller Zustände 
keine abgeschlossene Menge gibt. Ist die Wahrscheinlichkeit des Übergangs vom 
j-ten Zustand wieder in den j-ten Zustand (Rückkehr) nach m Schritten für 
wenigstens ein m ungleich Null, so heißt der größte gemeinsame Teiler i, aller m 
mit dieser Eigenschaft die Periode t, des j-ten Zustandes. Im Fall i, > 1 heißt 
der Zustand selbst periodisch. Besitzt eine Kette periodische Zustände, so heißt 
sie eine periodische Kette. 

Es sei nun , >%,—-:: eine Trajektorie der Markoffschen Kette. Wir be- 
zeichnen mit p(N) den Vektor mit den Komponenten p(ix = 1), ..., Plix = n). 
Eine für das weitere grundlegende, wichtige Aussage besteht dann in folgendem: 
Ist eine Markoffsche Kette mit endlich vielen Zuständen irreduzibel und nicht- 
periodisch, so ist sie ergodisch. Das bedeutet, daß unabhängig von der Anfangs- 
verteilung x der Grenzwert lim p(N) = p existiert. Die Komponenten des Vek- 

No 


tors P = (P1; ---, Pn) Sind positiv und stellen die stationäre Wahrscheinlichkeits- 
verteilung dar. Für ergodische Ketten ‘existiert auch der Grenzwert lim PN = 


N>o 
= Po. Dieser Wert ?. stellt eine stochastische Matrix dar, deren Zeilen alle 
identisch sind, und ® genügt der Gleichung pP =PP«. Bei einer unendlichen 
Anzahl von Zuständen ist auch der Fall lim P(N) = 0 möglich. Eine ausführliche 


Now 
Untersuchung dieser Fragen findet der Leser in dem Buch von FeLLer [1]. 


In vielen Aufgaben ist es von Interesse, die stationäre Verteilung einer Mar- 
koffschen Kette zu finden oder gewisse mit der stationären Verteilung verbundene 
Größen zu bestimmen. Grundlegend für die Anwendung der Monte-Carlo-Methode 
ist bei solchen Aufgaben das folgende Gesetz. 

Das starke Gesetz der großen Zahlen für Markoffsche Ketten (SARYMSAKOW [1]): 
Ist p die eindeutige stationäre Verteilung der stochastischen Matrix P, so güt für 
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jede Anfangsverteilung x und eine beliebige Funktion der Zustände f(y) die Gleichung 


N n 
P(Yim 2 2,1) = Erin) =1- (6.1.17) 


Dabei ist i, >i, >1, >: die Folge von Übergängen (die Trajektorie) der Mar- 
koffschen Kette. 


Für die Schätzung eines Mittelwertes über die stationäre Verteilung p genügt 
in daher, nur eine Trajektorie der Kette von hinreichend großer Länge zu model- 

ieren. 

Die Monte-Carlo-Methode ist ein besonders günstiges Hilfsmittel zur Unter- 
suchung von Markoffschen Ketten mit einer sehr großen Anzahl von Zuständen. 
Solche Ketten treten beispielsweise in der Bedienungstheorie und in der sta- 
tistischen Physik auf. Bei der Modellierung ist es in diesen Fällen mitunter nicht 
leicht, die Matrix ? in expliziter Form anzugeben, besonders wenn die Anzahl 
der Zustände in die Hunderttausend geht. Jedes genügend komplizierte, provi- 
sorische Modell, das in einem Zeitintervall At betrachtet wird und das die Eigen- 
schaft einer Markoffschen Kette besitzt, kann bei der Beschreibung der entspre- 
chenden Übergangsmatrix erhebliche Schwierigkeiten bereiten. Das schließt die 
Möglichkeit aus, die klassischen numerischen Methoden der linearen Algebra zur 
Berechnung der stationären Verteilung zu verwenden. Was nun die Monte-Carlo- 
Methode betrifft, so besteht dort die Schwierigkeit in der Schätzung des Ver- 
fahrensfehlers. 


Wir betrachten jetzt die Aufgabe, die Wahrscheinlichkeit P(c) einer gewissen 
Untermenge der stationären Zustände c zu schätzen. Wir erzeugen mit der Monte- 


Carlo-Methode eine Trajektorie w—1 —1i,—-:- und nehmen als Schätzwert 
von P(c) den Mittelwert 

N N 

Po=z (6.1.18) 


wobei N, angibt, wie oft das Teilchen einen zu c gehörenden Zustand eingenommen 
hat (Fall der Aufgabe C von Kap.T). Die Schätzung (6.1.18) ist erwartungstreu, 
konsistent und asymptotisch normalverteilt (vgl. Kap. TI). Ihre Dispersion kann 
durch ? und P% ausgedrückt werden (KemEnY und Sseıu [1]): 
D£i(c) = 2B(Z — E) Be + o(N2). 

Dabei ist B eine Diagonalmatrix, auf deren Diagonale die Elemente b;; = 1 für 
ie c und bi; = 0 sonst stehen, Z= (E — (#P — P%))"" mit der Einheitsmatrix E 
und e ein Vektor, dessen Komponenten gleich Eins sind. Es ist klar, daß die 
Anwendung einer solehen Schätzung erst recht in den Fällen unmöglich ist, in 
denen sogar die explizite Gestalt der Matrix 7 nicht zur Verfügung steht. GARA- 
BEDJAN und Romasowskr [1] schlugen folgendes Verfahren zur Konstruktion 
eines Konfidenzintervalls für P(c) vor. Der Übergang von einem Zustand in einen 
anderen soll in einem gewissen Zeitintervall erfolgen. Mit t,, ta, ..., iv, bezeichnen 
wir die Momente, in denen das Teilchen in einen Zustand ce gelangt, und mit 
u=tbı— 4; die Differenz zwischen diesen Zeiten. Die Folge r,, ..., tx, ist 
stationär, und es gilt Mr, = Mr = 1/P(c). Bildet [a”, a*] ein Konfidenzintervall 


13* 
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für Mr zu einem gewissen Konfidenzniveau, dann ist offensichtlich [1/a*, 1/a”] 
em Konfidenzintervall für P(e) zu demselben Niveau. 
Bekanntlich ist die Größe 
Ne—1 
T=(N-1)"T3 %=(v,.—b) (N. — 1) (6.1.19) 
i=1 


asymptotisch normalverteilt mit dem Erwartungswert Mr und der Dispersion 
bKN,.— 1) mit 


b = M((r: — Mr) (Ti4ı — Mr)) 
(Hannan [1], vgl. auch Kap. I). Die Größe b kann über die Folge {r,} durch 


P- k Ne—-1-—s = 2 
b,= & (N. — 1— s)"! = (rı — T) (Ti4s — 7) 
s= i= 


geschätzt werden. Wenn man r als normalverteilt ansieht, können wir a* und 
a” bestimmen und ein Konfidenzintervall für P(c) herleiten. 

Die genannte Methode kann man auch benutzen, um den Fehler des Skalar- 
produkts (h, p) zu bestimmen, wobei h ein gegebener Vektor mit positiven Kom- 
ponenten ist. Ausführlicher wird dieses Problem durch GARABEDJAN und Ro- 
MANOWSKI [1] untersucht, die auch numerische Beispiele für n = 20 angeben. 


Es ist klar, daß man bei der Bestimmung der stationären Wahrscheinlichkeiten 
und der mit ihnen verknüpften Größen genau wie bei der Lösung linearer alge- 
braischer Gleichungssysteme von der Modellierung einer beliebigen ergodischen 
Markoffschen Kette ausgehen kann. Man erhält dabei die notwendige Wahr- 
scheinlichkeitsverteilung, indem man ein Gewicht des Teilchens nach Formeln 
einführt, die den Formeln (6.1.4) und (6.1.5) entsprechen. 

Prinzipiell mag der Unterschied zwischen den Lösungsmethoden für lineare 
algebraische Gleichungssysteme und der Bestimmung der stationären Verteilung 
einer Kette nicht sehr groß erscheinen. Im ersten Fall geht es jedoch um unab- 
hängige Realisierungen der Trajektorien, während es im zweiten Fall um die Be- 
rechnung des Mittelwerts abhängiger Zufallsgrößen geht. Freilich ist es auch bei 
der Berechnung der stationären Verteilung nützlich, wenigstens einige unab- 
hängige Trajektorien zu verfolgen, besonders wenn Zweifel bestehen, ob die Kette 
irreduzibel und nichtperiodisch ist. Diese letzten Eigenschaften sind bei weitem 
nicht immer leicht festzustellen. Nützlich kann in dieser Beziehung auch ein von 
ROMANOWSKI [1] beschriebenes Verfahren sein, mit dem man kontrollieren kann, 
ob die ausgewählten Trajektorien repräsentativ sind. 


$2. Markofische Ketten und Integralgleichungen 


Es existiert eine umfangreiche Literatur, die sich mit der Lösung von Integral- 
gleichungen durch die Monte-Carlo-Methode beschäftigt. Eine der ersten Arbeiten, 
die diesem Problem gewidmet ist, ist die Arbeit von ALBERT [1] und in der so- 
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wjetischen Literatur die Arbeit von WLADIMIROwW und Sogor [1]. Eine ausführliche 
Bibliographie findet sich in den Büchern von BUSLENKO u.a. [1], HAMMERSLEY 
und Hanpscomg [1] und auch in der kürzlich erschienenen Monographie von 
SPANIER und GELBARD [1]. Einige Hinweise auf verhältnismäßig neue Arbeiten 
werden im weiteren Text gegeben. Vorher ist aber festzustellen, daß die in $1 
beschriebenen Verfahren zur Lösung linearer algebraischer Gleichungssysteme 
offensichtlich auf den Fall von Integralgleichungen zweiter Art verallgemeinert 
werden können. Dazu benötigt man aber den Begriff der Markoffschen Kette 
mit einer beliebigen Anzahl von Zuständen. 
Wir betrachten nun eine Integralgleichung der Form 


pl) u K(y, x) poly) dy + f@) . (6.2.1) 


D ist ein Gebiet des s-dimensionalen euklidischen Raumes, & € 2, /(#) und @(a) 
sind auf D definierte Funktionen, der Kern K(y, x) ist auf dem kartesischen 
Produkt D x D definiert, das Integral in (6.2.1) wird im Lebesgueschen Sinne 
verstanden. Obwohl auch die Betrachtung etwas komplizierterer Gleichungen 
(z.B. kann man die Integration allgemeiner definieren, etwa wie in Kap. IV) 
keine besonderen Schwierigkeiten bereitet, bleiben wir bei dem angegebenen 
einfachen Fall. An diesem Fall kann man, ohne die Darstellung zu kompli- 
zieren, alle prinzipiell wichtigen Fakten erklären. 

Für die Gleichung (6.2.1) soll nun die Methode der sukzessiven Approximation 
konvergieren. d. h., die Lösung g(&#) ist in Form einer konvergenten Reihe 


e®) - 2 Yıl®) (6.2.2) 
mit 
ya) = fa), Yıl®) = K(y, @) vi-ı(y) dy, = L3;. 


darstellbar. Dabei sollen die Funktionen p und / Elemente eines gewissen Banach- 
raumesF sein, und die Konvergenz der Reihe (6.2.2) ist in bezug auf die Norm 
dieses Raumes zu verstehen. Die Norm von Funktionen g aus F werden wir wie 
üblich mit ||o||r oder einfach mit ||g|| (wenn klar ist, um welchen Raum es sich 
handelt) bezeichnen. Die Gleichung (6.2.1) läßt sich dann bequem in der Form 


g=Kp+l (6.2.3) 


schreiben, wenn K den Integraloperator mit dem Kern K(y, x) bezeichnet. Wir 
wollen nun mit der Monte-Carlo-Methode ein Funktional 


J =f o(®) ha) de = (9, h) 
berechnen, wobei Re F* dem zu F adjungierten Raum (dem Raum der Funk- 


tionale) angehört. Das Funktional J kann auch durch die Lösung @* der zu 
(6.2.1) adjungierten Gleichung 


ve) = SEm Now) dy + he) (6.2.4) 
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ausgedrückt werden. Die Gleichung läßt sich analog zu (6.2.3) in der Form 
9* = K*p* +h 


schreiben. Genau wie in $ 1 zeigt man leicht, daß 
J= (9, h) = (f,9*) (6.2.5) 


gilt, d. h., unsere Aufgabe ist völlig symmetrisch bezüglich der Ausgangsgleichung 
(6.2.1) und der zu ihr adjungierten Gleichung (6.2.4). 


1. Lineare Schätzungen und ihre Erwartungstreue. In der Regel wird den Glei- 
chungen (6.2.1) oder (6.2.4) eine homogene Markoffsche Kette zugeordnet, die 
durch die Dichten ihrer Anfangsverteilung x({®) und der Übergangswahrschein- 
lichkeit p(y — x) gegeben ist. Der Fall einer nichthomogenen Markoffschen Kette 
ist wenig untersucht, und außer einigen allgemeinen Überlegungen ist es schwer, 
etwas darüber zu sagen. Die Untersuchung des ebenfalls allgemeineren Falles 
einer Kette, für die keine Dichte der Anfangsverteilung und der Übergangswahr- 
scheinlichkeit existiert, würde die Darstellung wesentlich komplizieren, ohne viel 
Neues in prinzipieller Hinsicht zu bringen. Für homogene Ketten {x,p} muß 
man einige natürliche Voraussetzungen machen, die mit der Absolutstetigkeit 
eines später einzuführenden Maßes zusammenhängen: 


1. Auf der Menge {x : f(@) = 0} ist die Funktion x(x&) positiv. 
2. Auf der Menge {x,% : K(y,&) +0} ist die Funktion p(y—x) positiv. 
Außerdem ist es günstig, 


[ru mde-1-gy), O<oW<I1, (6.2.6) 


zu setzen und g(y) als Wahrscheinlichkeit der Absorption beim Übergang von 
y nach & aufzufassen. 


Entsprechend den allgemeinen Modellierungsmethoden (Kap. II) wird eine 
Stichprobentrajektorie der Kette folgendermaßen konstruiert. Durch Modellierung 
einer Zufallsgröße mit der Verteilungsdichte z(x®) findet man den Punkt x,. Dieser 
Punkt liefert die Anfangskoordinaten des Teilchens, das sich längs der Trajektorie 
bewegt. Mit einer Wahrscheinlichkeit g(#,) wird das Teilchen nun absorbiert. 
Wenn keine Absorption erfolgte, wird die Zufallsgröße &, mit der Verteilungsdichte 
P(&, — @,)/(1 — g(a,)) modelliert. Ist also allgemeiner &;_, bekannt, so bricht 
die Trajektorie mit der Wahrscheinlichkeit g(&;-ı) ab und wird mit der Wahr- 
scheinlichkeit 1 — g(&;_ı) fortgesetzt. Dann ist ®; eine Realisierung der mit der 
Dichte p(&@;-ı > x.)/(1 — g(&;-ı)) verteilten Zufallsgröße. 

Ist also g>0, dann entspricht der Trajektorie &, > x, —'- —%, von der 
Länge k eine Wahrscheinlichkeitsdichte 


(8) Po >) Plaer-ı > ar) gr) - 
In diesem Fall sind fast alle Trajektorien endlich, und durch die angegebene 
Dichte auf den endlichen Trajektorien wird ein Maß definiert. 


Ist g = 0, dann haben fast alle Trajektorien eine unendliche Anzahl von Glie- 
dern. Ein Maß wird auf allen endlichen Abschnitten der Trajektorien &, >, 
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— +. —&n (auf den „Zylindermengen‘“) definiert. Nach dem Satz von KoLmo- 
GOROFF kann dieses Maß auf die Menge aller Trajektorien. erweitert werden. 

Das uns interessierende Funktional J wird nun als Mittelwert einer weitgehend 
willkürlichen Zufallsgröße über die ausgewählten Trajektorien geschätzt (Schäb- 
zung eines Funktionals). In der Regel wird vorausgesetzt, daß diese Schätzung 
erwartungstreu ist. Wir werden für g(@) >0 eine Schätzung der Gestalt 


” k k 
J[k] =2 ON 5 +, 2er) Alaeı) =2 AME,) hia;) (6.2.7) 
i= i= 
und für g(&) = 0 eine Schätzung der Gestalt 
Pr »o 
J[oo] = PR" 25...) hl) (6.2.8) 
i= 
betrachten. Dabei kennzeichnet k die Stelle, diedem Ende der Trajektorie entspricht; 
Q und @; sind gewisse gegebene Funktionen der Trajektorie, die als integrierbar 
nach dem auf der Menge der Trajektorien definierten Maß vorausgesetzt werden. 
Schätzungen der Art (6.2.7) und (6.2.8) werden wir linear nennen. Die Existenz 
ihrer Dispersion wird vorausgesetzt. 
Damit die Schätzung erwartungstreu ist, müssen die Funktionen Q(® und @; 


bestimmte Bedingungen erfüllen, die wir jetzt herleiten wollen. Dafür stellen 
wir das Funktional J = (g, k) in einer für uns bequemen Form dar: 


Wh) = 8 Shix) yıla) da 
=/ h(ae) [f@ +2 f die, FL de, K(#,,%) K(a2; 1, 2:) * K(3%,, 5) I) de. 
Durch eine Änderung der Bezeichnungen erhalten wir die äquivalente Gleichung 
(9; h) -Z Fi fx) K(&; &) - Klee; 1, 2) ha) dE; 
mMtAR = DXDX-xXDRA,=D und dS, = de, dE;, = da, de, -- da.. Der Er- 
wartungswert Se J [k] beträgt dann (g(&@) sei nicht iden- 
tisch Null) 
MILL] = 3, SLR) Die. > 1) Dlan-ı > as) Dia) Ar. 


Die notwendige Bedingung für die Erwartungstreue der Schätzung lautet 


(9, h) = MJIk]. (6.2.9) 
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Unter einigen zusätzlichen Voraussetzungen über die absolute Konvergenz der 
unendlichen Reihen kann man auch hinreichende Bedingungen für die Erwar- 
tungstreue erhalten. Eine der einfachsten Bedingungen dieser Art hat die Gestalt 


x 


BE F 1a) Kg &) - K(&-1, %) h(ar) 


—_ ZRNEN h(s) (2) PX, >) Pr -ı > Er) oe) dE;,=0. (6.2.10) 


Wir setzen nun 


a» = q,n'® (6.2.11) 

mit 
__ fa) En Kia) , Klin %) (6.2.12) 
aa)” Pam) Pi an)" 2 


Berücksichtigt man g(sr) —=1— [Pl — #41) da;;ı, so kann man die Glei- 
D 
chung (6.2.10) formal in folgender Form schreiben: 
S [1 — @(] fax,) h(ar,) da, 


+ Fi Faco) {m — 09] Ka 2) Klar 2) Ahle) 

Es 

+ > [0 ” FR alk+n] K(&%, &)  K(;-1: %:) has) Pla: > &i-ı) 
t=1 


.. Plar—ı >! dZ; =(. 


Wenn man hier die Integrations- und Summationsreihenfolge vertauscht, ergibt 
sich folgendes Resultat. 


Satz 6.2. Damit die Schätzung (6.2.7) im Fall ge) >60 für ze D und bei Er- 
füllung der Bedingungen 


1. 5 JIOP Ka) Ku a) Kar 21) han)| dEr < ©; 


oo oo 
.2.& So — ED) fa) K(&y, 1) 
i=0 k=0 Ak 


- K(&;-1, %) ha) pie: > &i-ı)  Pl@x-ı >ar)| dFR < 0 
erwartungsireu ist, ist die folgende Gleichung hinreichend: 
oo oc 
ES IR) Kia 2) Klaei-ı, 8) har) 1-0P- EZ S leP-oft+N] 
i=0 Ri kei Ri+H-1 


x Pl > ir) Pie > Er) dir = da) 4, =0. (6.2.13) 
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Ein spezielles Interesse kann der Fall beanspruchen, in dem die @ nur von 
den ersten © + 1 Veränderlichen &,, ..., @; abhängen, da die Rechnung sich dann 
meistens vereinfacht. Die Gleichung (6.2.13) wird in diesem Fall auch etwas 
einfacher und kann in folgender Form geschrieben werden: 


ei FRI Kay 2) Klai-1, #:) hai) I = 09 — 3 [n+N — aM] 
k=i 
x Ser Fi ıPpl®; —8i 1) P(r Fr Zen): dE; =, (6.2.14) 


Ebenso lassen sich die Bedingungen für die Er wartungstreue im Fall g = 0 her- 
leiten. Etwas komplizierter ist der Fall, wenn g(&) auf einer Teilmenge von 2 
verschwindet. Aber auch hier haben die Schwierigkeiten keinen prinzipiellen 
Charakter, sondern sind rein technischer Art. Wir bemerken noch, daß man die 
Gleichung (6.2.13) durch verhältnismäßig einfache Umformungen auf die Gestalt 


DREI Do >) Placi-ı > ;) gih(&,) 


x 
x N = BIN S dx; 1 .. S IE Pla; — a; } 1) Plar-ı — 4) g(6;) | ds; = 
k=iD D 


(6.2.15) 
bringen kann, die fiir die Anwendungen manchmal bequemer ist. 


2. Beispiele erwartungstreuer Schätzungen. Wie man leicht an den Gleichungen 
(6.2.13) und (6.2.15) erkennt, enthält die Klasse der linearen erwartungstreuen 
Schätzungen auch sehr ‚pathologische‘ Schätzungen, die zu unnötig kompli- 
zierten Rechnungen führen. Zur Festlegung der Markoffschen Kette wäre es 
natürlich, die Dispersionen der Schätzungen unter verschiedenen Voraussetzungen 
bezüglich der Klasse der zu schätzenden Funktionale und der Klasse von Integral- 
gleichungen miteinander zu vergleichen. So kann leicht der Begriff der zulässigen 
Schätzung formuliert werden, der sich in diesem Fall in nichts von dem in der 
mathematischen Statistik üblichen Begriff der Zulässigkeit einer Schätzung unter- 
scheidet. Allerdings ist die analytische Darstellung der Dispersion von Schät- 
zungen für eine genügend umfangreiche Klasse recht schwierig, wie wir noch sehen 
werden. Man kann das auf die noch unzureichenden Untersuchungen dieses Pro- 
blems zurückführen. Zweckmäßig wäre es, eine genügend umfangreiche Klasse 
in numerischer Hinsicht einfacher Schätzungen ausführlicher zu studieren. Die 
Hervorhebung einer solchen Klasse setzt aber den Beweis voraus, daß es keine 
weiteren in numerischer Hinsicht einfache Schätzungen gibt, sowie die Präzi- 
sierung des Begriffes „einfach“. Man kann erwarten, daß diese Probleme in 
nächster Zeit die Aufmerksamkeit der Mathematiker finden werden. 

Nun geben wir einige einfache Beispiele erwartungstreuer Schätzungen an und 
untersuchen ihre Dispersionen. Eine der meistgebrauchten Schätzungen ist die 
folgende: 


” k 
Jılk] = z hl) ; ge) >0, (6.2.16) 
d.h.oP®P = 1 für alle i und k. Dann ist (6.2.13) offensichtlich erfüllt. 
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Ebenso einfach überprüft man die Erwartungstreue der Schätzung 
hir) 


en 3.2. 
AT N: (6.2.17) 
für die 
i | l/jg@u) für i=k, 
wid) — 
i 0 für i+k 


gilt. Im Fall g(&) = 0 prüft man leicht unmittelbar die Erwartungstreue der 
Schätzung 

Jıl®] =. gh(:) (6.2.18) 

r= 

nach. Setzt man den Ausdruck in den geschweiften Klammern jedes Summanden 
von (6.2.15) gleich Null, so erhält man hinreichende Bedingungen für die Erwar- 
tungstreue in Form eines Gleichungssystems für die Funktionen »(®. Die Klasse 
von Schätzungen, für die dieses Gleichungssystem erfüllt ist, wurde von CHISSA- 
MUTDINOW [2] betrachtet und von ihm Einsklasse genannt. Wir werden hier einige 
erwartungstreue Schätzungen anführen, wie sie von CHISSAMUTDINOW, aber auch 
von MicHA1Low [6] hergeleitet wurden. Durch verhältnismäßig einfache Rech- 
nungen kann man überprüfen, daß diese Schätzungen zur Einsklasse gehören 


Mh) 


n E en Mr ST, 
Jz[lk] = 4 [11 — gar -)]) Tl — glar-ı)] gar) = (6.2.19) 
0 für k<l; 
Ir -ıh(er-ı) a r R 
z werd, 5 ge Ar Bet, 
a en een er Je (6.2.20) 
0 für k<T; 
Ir ıh(Ak m) ..& 
> R —_— - - ) hi), I-m>0. 
Se] = U der ee med. ao 
) 


Dabei sind Z und m beliebige natürliche Zahlen. 
So stellen (6.2.19) und (6.2.20) vom Parameter ! abhängige Scharen von Schät- 
zungen dar. Die Schätzung (6.2.21) hängt von den beiden Parametern m und l ab. 


Eine beliebige Linearkombination erwartungstreuer Schätzungen mit Koeffi- 
zienten, deren Summe gleich Eins ist, bildet offensichtlich wieder eine erwartungs- 
treue Schätzung. Insbesondere besteht eine der vielen Verfahren zur Dispersions- 
verkleinerung in einer geeigneten Wahl dieser Koeffizienten auf Grund einer 
empirischen Schätzung der Dispersion und Kovarianz im Verlauf der Rechnung. 


3. Die Dispersion der Schätzung. Die Frage der Dispersion der Schätzung wird 
in einer Reihe von Arbeiten behandelt, von denen wir besonders auf die Arbeiten 
von SOLOTUCHIN und ERMAKOW [1], SoLOTUcHIN und DEJEw [1] und Mic#aTLow 
[4] hinweisen. Von Marorow und FRANK-KAMENEZEI [1] wurde kürzlich die 
Dispersion für eine Klasse von Schätzungen in geschlossener Form erhalten. 
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Es bereitet offensichtlich keine Schwierigkeit, einen Ausdruck für die Dispersion 
einer beliebigen Schätzung in der Gestalt eines Integrals über das durch die Mar- 
koffsche Kette definierte Maß hinzuschreiben. In manchen Fällen ist es allerdings 
möglich, einen einfacheren Ausdruck für die Dispersion herzuleiten. Wir be- 


schränken uns auf die Betrachtung der Schätzungen J ı[%] und J,[k], die auch 
am meisten angewendet werden und verhältnismäßig einfach sind. Wir setzen 
die Konvergenz der im weiteren auftretenden Reihen voraus, und schreiben nun 


den Ausdruck für die Dispersion der Schätzung Js[k] in folgender Form: 


DIR] 2 f Fk] (a) pi, —®;) -- Pl > u) gl) AZ, — (9, h)? 


Pia) _K*lio, 2) e K’la.- -1, 82) Äh *(2:) 
20) ÜR) Pl > 2) Pl > Er) glare) 


dE, — (9, h)?. 


Ak 
Hieraus ergibt sich 
& 2 
DJ,[k] = (7 v) — (9, h)?, (6.2.22) 
wobei y eine Lösung der Gleichung 
K’y, &) P®) 
x) = | ——— d 6.2.23 
vi) f De AUT ( ) 


ist. Führt man die zu (6.2.23) adjungierte Gleichung ein, so kann man das obige 
Resultat in der Gestalt 


4 Pi) 
= (y* _ )? 2.24 
DJ;[k] (v iz) (9, h) (6 ) 
schreiben, wobei y* Lösung der Gleichung 
K:(&, y) h2(se) ar 
*(2) — y*ly)d 6.2.25 
y*®) Is Fra a6) Bu ( ) 


ist. Gehört also h?/g zu einem Banachschen Funktionenraum H*, ist ?/zceH 
und bildet der Operator U mit dem Kern K?(y, &)/p(y—=) den RaumH in sich ab, 
so ist für die Existenz und Endlichkeit der Dispersion einer Schätzung Jlk] in 
dem Raum H hinreichend und notwendig 


lim ju# [m < 1 
k>00 


(vgl. KANToRowITscH und AkKILOW [1]). 

Wir werden die Bedingung nicht weiter konkretisieren, die die Endlichkeit 
der Dispersion der betrachteten Schätzung sichert. Man prüft in jedem konkreten 
Fall leicht nach, daß die Menge von Integralgleichungen und entsprechenden 
Markoffschen Ketten, für die die Dispersion der Schätzung endlich ist, nichtleer ist 
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Man kann umgekehrt Gleichungen angeben, für die bei beliebiger Wahl der 
Markoffschen Kette die Norm des Operators U größer als Eins ist. Ein einfaches 
Beispiel dafür ist das folgende (Harrox [3]). Es sei K ein Matrizenoperator . 


a —a 0 
K=la -—a 0|, M< 1, a>]l. 
0 04 


Man prüft leicht nach, daß der betragsgrößte Eigenwert von K gleich A ist. Der 
entsprechende Operator U wird durch die Matrix 


a __@ 0 

Ppı1ı Pı,2 

a _@ 0 , 

p3,ı p 

oo X 
D3,3 


0<pm,;<1b Wji=l2% 0<ps<1l Mıtpı,as1; Ppıtp.2<s1 


definiert. Bei beliebigem zulässigem p;,; gibt es einen Eigenwert von U, der 
größer als Eins ist. 


Wir kommen nun zur formalen Berechnung der Dispersion der Schätzung J ıl%]» 
was gegenüber den bisherigen Betrachtungen wesentlich komplizierter ist. Zu- 


nächst berechnen wir M/? i[%]. Dazu setzt man 
7 = (Mg) Pl >) Plarr-ı > Me) > = ra). 


Dann gilt 

MÄR] 2 SdEuch[k)? male) 

= / SdErld, [%])? |! —/ pa. >] 

=> ABA mr — B> S AErzıch[k + Wars 
=0 A k=0 Rr+ 

+ F SE, ll + 1° All]zrrı 


k=0 Rr+ı 


= S dach [0)? +3 A dZ4:1[Jılk +1] + Alk] Wil + U Alk] zerı 


2 


Bi RE) + 22 In [FH H19eHıh(er4ı) & Fade) Tr+ı 
k=0 Ak 


+28. 
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Man sicht leicht, daß der erste Summand $S, in dem letzten Ausdruck nichts 
anderes ist als das Funktional (A?, y), wobei y die Lösung der Gleichung (6.2.23) 
ist. Wir berechnen nun den zweiten Summanden 


[> k 
S=% | dErrgerıkhlerrı) Z Ghleı) rrrı 
k=0 i-0 


fo), Ka &) © Kl, 2-41) 
eK) Pl >) Pla > Fr 41) 


Fe 
Fa 
+ 


h(&r+1) 


! 
IMa 
mu 


* fa) Klo x)" Ks; 1, &:) 
i=0 TA.) Paco = Plei-ı >) 


© &k 2; 2 + Kl; 
=, r as, 0) K (2; &ı) K*(@:-1, %:) neo [da [azıcı 


k=0 i=0 rl) PR, > 0) Plai-ı > %:) 


h(3e:) (8) Pl&o > #1) Pl&r > +1) 


x Kia, 2:1) Kl 241) hl +1) 


wo %& z 
=), PaL- A:la) BU .(e) 
D 


Er Po) Kay, 2) K?(&_1, &) 
nr [ IE) DE >) 
ö 
Bi} 1(®) / dei daepyı K(®, 8-1) Kl 841) Alarrı) » ! 


_ Durch =. ee Summationsreihenfolge ergibt sich 
FE „dr Ara) BO (x) = a, fr Ale) Bi). 


k=0 20 3 
Nun hängt BA (x) nur von der Differenz der Indizes s= k — iab. Ändert man 
die Bezeichnung in Bi} (®) etwas ab und summiert nach der Veränderlichen s, 


so erhält man 
NM r 
&= lm E 5 Sda Al) B£},®) 
N>0, N >w il k-iD 
N M-i 
= lim 2 PX S de A;(®) B;+1(®) 
N>0, N>+% i-0 3-0 2 
mit 
B,(#) = dy, 2 dy, Ki, yı) - K(ys-1, 9) h(®) » 
Nun gilt aber 
EB) = [Ka y)p'ydy und 3 Ada) = ha) yle), 
s= j= 


wobei p*(®) und y(a) Lösungen von (6.2.4) bzw. (6.2.23) sind. 
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Damit erhält man 
= [de (a) ylr) [ Kim, y) P*y) dy 
—= f de h(&) y(&) [p*(ae) — A(ae)] dae (6.2.26) 
D 
und schließlich 
DA [k] = (2hp* — RR, y) — (@, h)®. (6.2.27) 


Genau wie bei der Schätzung J,[k] kann man zur adjungierten Gleichung über- 
gehen und erhält 


DJ, = (v*. 2 (ph), (6.2.28) 
wobei y* hier Lösung der Gleichung 
K?(z, 
u PTW ER + na) 2p*e) — Me) (6.2.29) 
D 


ist. Durch völlig analoge Überlegungen kann man die Dispersion der Schätzung 
J,[oo] berechnen. Dabei hat der Ausdruck für die Dispersion dieselbe Gestalt 
DJ, [oo] = (2hp* — h?,y) — (h,p)?, und es gilt auch die adjungierte Formel 
(6.2.28). 

Die erhaltenen Resultate bilden den Inhalt des folgenden Satzes. 

Satz 6.3. Wenn die Existenz und Endlichkeit der Dispersion vorausgesetzt wird, 
dann gilt: 

1. Die Dispersion der Schätzung Jı[k] bzw. Jı[oo] des Funktionals J ergibt sich 
aus (6.2.27) und (6.2.28), wobei y und y* Lösungen der Gleichungen (6.2.23) bzw. 
(6.2.29) sind. 

2. Die Dispersion der Schätzung J,[k] ergibt sich aus (6.2.22) und (6.2.24), wobei 
v und w* Lösungen der Gleichungen (6.2.23) bzw. (6.2.25) sind. 

Bemerkung. Es sei r(&) eine beliebige streng positive und in D endliche 
Funktion. Wegen 

Mac) Kto, 81) + K*aer-ı, 2a) 
TÜR) PR > U) Pier-ı > %r) 


ao) 


(do) 


Är 
K’ 2) via) , Kr, 2) rer) Aa) 15 
PR > Er) ri)  Platn-ı > @u) r@e-ı) ? ne“ 


r(&0) 


Rx 
(6.2.30) 


kann man die Bedingung,lim ||U*]]1'® < 1 durch die dazu äquivalente Bedingung 
lim Als < 1 ersetzen, wor! Ü der zum Kern K?(y, x) r(@)/p(y > x) r(y) ge- 
härige Operator ist. 
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„Ein Vergleich der Ausdrücke für die Dispersionen der Schätzungen J,[k] und 
J,[lk] zeigt, daß in Abhängigkeit von der Gestalt der Gleichung und von der be- 


nutzten Markoffschen Kette entweder Je] oder J[k] günstiger sein kann, d.h., 
man kann nicht behaupten, daß eine der beiden Schätzungen von vornherein 
schlechter ist als die andere. Zur Begründung dieser Behauptung genügt es, die 
Funktionale (h?/g, y) und (2)p* — h?,y) zu vergleichen. » ist in beiden Fällen 
dieselbe Funktion. Wir nehmen nun an, daß A,@* und K(&,y) positive Funk- 
tionen sind. Dann gilt 

o*=KrYyt+hzh für alle & 
und daher 2hp* — h?> h?. Weiter gibt es ein solches K, daß 

ahy* — = —=h?+6 
mit ö6 = ö(&) > 0 erfüllt ist. In diesem Fall ist 

(Arp* MR, y)= (+6, Yy), 
und für 

2) 


I) > a) +5 
gilt die Ungleichung 


h? 
(7 v) < (2hp* — RP, y). 


Ist aber g(a@) genügend klein, so gilt in der letzten Ungleichung offensichtlich 
das entgegengesetzte Zeichen. 

Der Rechenaufwand bei Anwendung der Schätzungen B5 und J, unterscheidet 
sich bei einfachen A(#) nur wenig. Die zusätzliche Arbeit der Summation bei 
Anwendung der Schätzung J, kann gewöhnlich vernachlässigt werden. Wenn aber 


die Berechnung der Werte von h sehr aufwendig ist, dann kann die Schätzung de 
bei entsprechender Wahl von g(&) in einigen Fällen günstiger sein. Dabei sollte 
man beachten, daß sich diese Aussagen auf die Berechnung eines konkreten 
Funktionals beziehen. 


Wir untersuchen nun die Form der Dispersion in einigen konkreten Fällen, 
die von besonderem Interesse sein könnten: 
a) K(y, x) ist eine nichtnegative Funktion, die der Bedingung 


Jun M-1-gg): 0<sey)<I1l, 


genügt, für x) gilt /{x)>0. Hier kann man K(y,&) = p(y—x) und r(&) 
= f{@)/ S f{@) de setzen. Wir nehmen weiterhin an, daß / fa) de = 1 ist, da 
D 


das stets durch eine einfache Variablensubstitution erreichbar ist. Dann gilt 
» [ha 
var,  Du-(n,r)- pm, 
DJ, = (2hp* — R2,g) — (9, h)®. 


(6.2.31) 


208 VI. Markoffsche Ketten und damit zusammenhängende Probleme 


b) p(y — x) ist im Gebiet D konstant und auch x(&) ist eine Konstante. Das 
ist ein ausgearteter Fall, denn &,, &, ..., &; stellen unabhängige und im Gebiet D 
gleichverteilte Zufallsgrößen dar. Das Rechenverfahren entspricht der Berechnung 
jeden Gliedes der numerischen Reihe für g nach der einfachsten Formel (4.1.18) 
(gewöhnliche Monte-Carlo-Methode). Die einzige Besonderheit bei der Berechnung 
des folgenden Gliedes der Reihe ist die Benutzung der früher gewählten #;-Werte, 
die bei der Berechnung des vorangehenden Gliedes der Reihe benutzt wurden. 
Die Funktion y genügt der Gleichung 

va)—/ K?(y, €) yy) dy + P@) . 

ce) Der Kern K(y,&) und die Funktion f ändern in D ihr Vorzeichen, aber für 
p und x kann man |X(Y, &)| und |f{@)| wählen. Die Funktion » genügt der Glei- 
chung 

62) =; IK(y, @)| yy) dy + If@)l - 


Die Dispersionen der Schätzungen (6.2.19) bis (6.2.21) werden wir nicht in ge- 
schlossener Form angeben. Für die Schätzung J, ist das übrigens ebenso wie für 
J, nicht besonders schwierig. 


4. Über das Versehwinden der Dispersion einer Schätzung. Es sei J eine erwar- 
tungstreue Schätzung des Funktionals J und {x, p} eine Markoffsche Kette, die 
den Bedingungen (6.2.6) genügt. Die Wahl einer anderen Kette {7, ?}, für die 
auch die Bedingungen (6.2.6) erfüllt sein sollen, bedeutet den Übergang auf ein 
anderes Maß. Mit anderen Worten, ist 5, eine feste Trajektorie der Kette {z, p} 
und z, das Maß auf der Menge solcher Trajektorien, und sind &, und u, Tra- 
jektorie bzw. Maß in bezug auf {7, 9}, dann gilt 


2 ns ad = 
J= [ Iu,(dS,) = [ J Ze 1(d3,) (6.2.32) 
Ma 


Die absolute Stetigkeit des Maßes «, bezüglich u, ist gesichert, wenn die Bedin- 
gungen (6.2.6) erfüllt sind. Aus (6.2.32) folgt vor allem, daß lineare Schätzungen 
bei Änderung des Maßes ihre Form behalten. Außerdem kann man nach den 
allgemeinen Resultaten (Kap. IV, $1) ein Maß u = u, derart wählen, daß die 
Dispersion der Schätzung Jdu,/dyg verschwindet. 

Die formale Anwendung der Beziehung (4.2.3) führt zu folgender Aussage über 
das Maß , im Fall der Schätzung Jzlk]: Einer Trajektorie der Länge k entspricht 
die Wahrscheinlichkeitsdichte 

7% = fl) K(& 8) Klar, 8) en (6.2.33) 
(wobei die Funktionen f, K und h in D als nichtnegativ vorausgesetzt werden). 
Wie auch bei der Integralberechnung wird für die Anwendung ein Maß gesucht, 
das zu einer genügend kleinen Dispersion führt. Vom numerischen Standpunkt ist 
es bequem, eine homogene Markoffsche Kette zu konstruieren, so daß der Mittel- 
wert über deren Trajektorien eine kleine Dispersion besitzt. Die Konstruktion 
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einer solchen Kette, die auch der gegebenen Aufgabe entspricht, ist nicht trivial. 
Unter Benutzung der Lösung &* von Gleichung (6.2.4) kann man in diesem Fall 
folgendermaßen vorgehen. Man schreibt (6.2.33) in der Form 


P*(&) 


TE Ki) Dee) 
I) Fr  ; 
x Ka a) u) Rn) re De) 


Aus (6.2.4) und der Positivität der Funktionen K und h folgt nämlich $*(&) > h(&), 
und man kann h(#)/p*(@) = g(a#) setzen. Außerdem gilt 


pay) — hy) =; K(y, x) p*(@) dae 


und 


a zen | 


*y)  P*y) — hy) 9*(y) 


K(y, ©) 9*(&) 
ST Ry.a)gra)da I: 


d.h., man kann 


P*(®) 
Kiy, x — —= 
(y. *) 9*y) ry ) 
setzen. Weiterhin ist es klar, daß man f(&) g*(z)/J als z(s) wählen kann, da die 
Normierungsbedingung (f, 9*) = J erfüllt ist. Das Resultat kann man im fol- 
genden Satz formulieren. 


Satz 6.4. Die Funktionen f(&), h(#) und K(a, y) seien nichtnegativ für alle & 
und y aus D. Wählt man dann die Markoffsche Kette 


‚? ie) : au IR 


so ist die Dispersion der EEE Jlk] gleich Null. 


Zur Realisierung der Markoffschen Kette mit verschwindender Dispersion be- 
nötigt man also außer der Größe des Funktionals J auch die Funktion p*(x). 
In vielen physikalischen Aufgaben hat die Funktion 9*(#) einen bestimmten Sinn, 
und man kann begründete Aussagen über ihr Verhalten machen, d.h., @*(a) 
kann näherungsweise gegeben sein. Das Ergebnis von Satz 6.4 ist dabei offen- 
sichtlich nur dann von Interesse, wenn die Dispersion der Schätzung in bezug auf 
kleine Änderungen von @*(&) stabil ist. Man kann zeigen, daß diese Stabilität 
tatsächlich gilt. Wir ersetzen dazu 9* durch @*(z) mit 


P*x) = p*l@) + 2), e(@)e F*, Fra) >0, 
und setzen 


_ fa) #*(®) K(y, x) #*(®) 
AT 


14 Ermakow, Monte-Carlo-Methode 
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Dann erhält man nach einfacher Zwischenrechnung 


= zug [W) + et) — SF KW, 2) ete) da]. 
Ist dabei 0O< g(y) < 1, so ergibt sich y(x) aus der Gleichung (6.2.4) 


__ px) 
y(z) = FE) Y-+( e)] 


und nach Satz 6.3 


wobei die Möglichkeit der Anwendung von Satz 6.3 durch die Bemerkung zu 
diesem Satz begründet werden kann. Wie man leicht sieht, strebt mit |je]|r« — 0 


auch DJ, gegen Null. 

Unsere bisherigen Betrachtungen bezogen sich auf den Fall einer positiven 
Absorptionswahrscheinlichkeit und der einfachsten Schätzung Ile]. Dieser Fall 
ist in genügendem Maß charakteristisch. Für g(@) = 0 kann man auch eine 
Markoffsche Kette konstruieren, für die die Dispersion der Schätzung Jloo] ver- 
schwindet. Es gilt hier folgendes Resultat. 


Satz 6.5. Die Funktionen f(&), h(x) und K(x, y) seien positiv. Setzt man dann 


BO | re 
und 
KK, ©) 9*(®) 
PUT Try, a) pre) de’ 


so ist die Dispersion von J,[0] gleich Null. 


Beweis. In diesem Fall ist 9(y) = 0. Die Normierung von z(&) und PYy—>*) 
überprüft man leicht direkt. Wir benutzen nun den Ausdruck (6.2.28) für DJ, [oo] 
und finden dazu yp*(x) aus der Gleichung 


[Ki y) 
y*(®) Een y*ly) dy + hie) [2p*(ae) — h()]. 
Wegen 
Rn _ Kia, y) p*(y) 
PRINT a) — Ka) 
gilt 


y*(y) dy + ha) [2p*(e) — h(e)] - 
(6.2.34) 


wi — [ RK: y) Ip*@) — he)] 
en [ FF) 
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Diese formale Rechnung findet wie schon früher ihre Begründung durch die Be- 
merkung zu Satz 6.3. 
Die Gleichung (6.2.34) schreiben wir nun in der Gestalt 


y*le) = [p*(@) — hiw)] nf Ken dy + hie) [2p*@) — hie] 


oder in der dazu äquivalenten Form 


n x, 
y*la) = p*e) / K(&, y) nr dy + 2a) 


— hie) | fi Kay) a + 1e)|. 


Fr) 
Wie man leicht sieht, ist y*(a) = [g*(a)]° eine Lösung dieser Gleichung. Setzt 
man in den Ausdruck (6.2.28) für DJ,[] die Werte für y*(@) und z(x) ein, so 
ergibt; sich 
2 MY a 
Die] = (er) 0. 


Ä 


was zu beweisen war. 


MicHATLoWw [4] erhält in einer Arbeit das stärkere Ergebnis, daß unter den Be- 
dingungen von Satz 6.5 die Schätzung J[o] auf allen Trajektorien der ent- 
sprechenden Markoffschen Kette konstant ist. Das wird mit Methoden bewiesen, 
die den beim Beweis von Satz 6.1 in $ 1 gebrauchten Methoden ähnlich sind. 

Ebenso wie für die Schätzung Jo[k] kann man zeigen, daß die Dispersion der 
Schätzung Bi für P*(@) = p*(®) + e(x) anstelle von p*(x) der Norm nach bei 
kleinem e stabil ist. Die Rechnungen sind in diesem Fall allerdings komplizierter. 


5. Weitere Methoden zur Dispersionsverkleinerung. Wie wir schon sahen, gibt 
es bei der Integration über die Trajektorien einer Markoffschen Kette gegenüber 
den allgemeinen Resultaten des vierten Kapitels gewisse Besonderheiten, insbe- 
sondere bei der Methode der wesentlichen Stichprobe. Was die Methode der Ab- 
trennung des Hauptteils betrifft, so bereitet ihre Anwendung keine Schwierig- 
keiten. Es sei nämlich = Ko + f die zu lösende Gleichung und 9’ = K’p’ + f’ 
eine dazu ähnliche Gleichung mit bekannter Lösung. Dann ist die Differenz 
9 — o = Ap Lösung der Gleichung 

Ip= KA + (K- Ke+f-f, 
die sich nur in der rechten Seite von der Ausgangsgleichung unterscheidet. Ist 
Ag klein, so kann der Gewinn bedeutend sein. Keiner besonderen Erklärung 
bedarf der Fall, daß einige der ersten Glieder der Neumannschen Reihe analytisch 
berechnet werden können oder daß die Integration nach einigen Veränderlichen 
leicht analytisch durchführbar ist. Damit kann man in der Regel den Rechen- 
aufwand wesentlich verkleinern. 

Mit den stochastischen Quadraturformeln kann man den Übergang zu einem 
verzweigten Prozeß verbinden (FroLow und TscHEnzow [2], FroLow [1]). 


14* 
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Wir stellen den Kern K(y, &) in Form einer Summe 
m-—1 
K(y, ) =2 K,(y, &) (6.2.35) 
ji= 


dar und entsprechend den Operator K durch 


Das I-te Glied der Neumannschen Reihe der Gleichung (6.2.1) kann in der Form 


m—1 
n=KY=[K+R+-+Kuhli= 2% Ki + Kuf (6.2.36) 
Dre 
dargestellt werden. Es ist bequem, hier eine symbolische Bezeichnung einzu- 
führen. Dazu faßt man i,, ..., ; als Zahl aus einem m-Positionssystem auf. Be- 
zeichnet man nun mit 7", die Menge aller I-stelligen Zahlen des m-Positionssystem 
und mit ya, = (%, «+, 1) eine bestimmte Zahl daraus, so kann man 


P1 = P2: K;, “..r Kuf 
yelt 


schreiben. Nun sei y(y—x), i=1,...,n, die Übergangsdichte einer Markoff- 
schen Kette, wobei p.(y —x) > 0 für K,(y, x) >0 und 


JR lg). 0<say)<1l 


gilt. 

Wir konstruieren nun einen Verzweigungsprozeß, in dem jedes Teilchen m ana- 
loge Teilchen bildet, die den Indexj, 1<j<m, erhalten. Das im Punkt y ent- 
standene Teilchen mit dem Index j geht dann entweder mit einer Wahrschein- 
lichkeit, deren Dichte p,(y —x)/(1 — 9;(y)) beträgt, ir den Punkt « über, wobei 
sich seine Masse um den Faktor K,(y, @)/p;(y — x) vervielfacht, oder es wird mit 
der Wahrscheinlichkeit g,(y) im Punkt y absorbiert. Die auf diese Weise ent- 
standene Teilchenlawine wird durch ein Teilchen hervorgerufen, dessen Teilung 
mit seiner Entstehung beginnt. Die Wahrscheinlichkeitsdichte, die einem Zweig 
des Trajektorienbaumes von der Länge / entspricht, beträgt 


(20) Pi, > 2) pi, (aid > a) pe ee) le”) . 


Hierbei ist i, der Index des Teilchens selbst, und %_1; %-2, ..., ?, sind die Indizes 
seiner „Vorfahren“ in den vorangehenden Generationen. Dann gilt der folgende 
Satz 


Satz 6.6. Es sei 
2 k (k) 
J= ER di; (Ko: ae X.) h(ae;) 
t{=1 


eine lineare erwartungstreue (nach (6.2.15)) Schätzung auf den Trajektorien der 
Kette {rr, p}. Dann ist die lineare Schätzung 


n k t . i A 
J = I 10” (a, 2”, ..., 29) Rah”) (6.2.37) 
{=1 


$2. Markoffsche Ketten und Integralgleichungen 213 


auf den T'rajektorien des Verzweigungsprozesses, für die 
m 


p(y—%&) = 2 sPıy >®), s >0, zus =1, 


Fa) Kaya)  Kulallid, 9) 
ER) Pi,(a. > aid) pa > El) 


gilt und die Bedingungen (6.2.6) und (6.2.36) erfüllt. sind, eine erwartungstreue 
Schätzung des Funktionals J. 


Der Beweis erfolgt unmittelbar aus (6.2.36), aus der Linearität der Schätzung 
und aus der vorausgesetzten Gültigkeit von (6.2.15). Daher kann man außer 
einer homogenen Markoffschen Kette zur Lösung von Integralgleichungen auch 
eine verzweigte Kette benutzen. 


Gibt es ein durch eine homogene Markoffsche Kette beschriebenes Modell einer 
Erscheinung, dann kann man in gewissen Fällen zur Verkleinerung der Dispersion 
der gesuchten Größe unter Benutzung von Satz 6.6 zu einem verzweigten Prozeß 
übergehen. Umgekehrt gibt derselbe Satz die Möglichkeit, zu einer linearen Kette 
überzugehen, wenn es ein durch eine verzweigte Kette beschriebenes Modell gibt. 
Die Anwendung einer stochastischen Quadraturformel bezüglich jeder Veränder- 
lichen xy, 2, . . . liefert auch eine Zerlegung (6.2.35) des ursprünglichen Kernes 
in eine Summe von Kernen. Im allgemeinen können allerdings beim Gebrauch 
einer Quadraturformel die eine Markoffsche Kette auszeichnenden Eigenschaften 
verloren gehen. 

Numerische Probleme, die mit der Modellierung verzweigter Prozesse verknüpft 
sind, wurden in der Literatur recht ausführlich untersucht (GoLENko [1], FRoLow 
[1])-. Wenn wir als einen Versuch die Realisierung des ganzen Baumes ansehen 
(wobei der positive Kern K(y, &) in positive Summanden X,(y, &) zerlegt wird), 
dann führt die Verzweigung zur Dispersionsverkleinerung eines Versuches aber zur 
Vergrößerung des Rechenaufwandes. Unter diesen Bedingungen ist die Her- 
leitung numerischer Verfahren hoher Effektivität eine wichtige und noch ver- 
hältnismäßig wenig untersuchte Aufgabe. Für das Problem des Strahlendurch- 
gangs wurde diese Frage i in einer Reihe von Arbeiten untersucht (z. B. Kann [1], 
Ocıeın[1]). 

Abschließend soll noch einmal bemerkt werden, daß die bevorzugte Betrachtung 
homogener Markoffscher Prozesse ausschließlich im Hinblick auf die einfache Dar- 
stellung geschah. Tatsächlich bleiben lineare Schätzungen, für die die w® den 
Bedingungen (6.2.15) genügen, auch bei nichthomogenen Markoffschen Prozessen 
und sogar bei Prozessen allgemeinerer Art erwartungstreu, wenn nur die g; in 
entsprechender Weise gewählt werden. Dieselbe Bemerkung gilt auch für ver- 
zweigte Prozesse, bei denen man einen Zerfall des Teilchens in eine bei jedem 
Schritt verschiedene Anzahl von Teilchen betrachten kann (entsprechend der Zer- 
legung des Kerns in Summanden). So kann man jedem Markoffschen Modell eine _ 
unendliche Menge von Modellen zuordnen, die im allgemeinen zu einem unter- 
schiedlichen Arbeitsaufwand bei der Lösung der gegebenen Aufgabe führen. Das 
grundlegende Problem besteht daher in der Wahl eines konkreten und effektiven 
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Modells. Dieses Problem ist aber in der gegenwärtigen Zeit noch nicht einmal 
vollständig formuliert. Meistens wird es durch intuitive (oder in Aufgaben mit 
physikalischem Inhalt durch sogenannte „physikalische‘‘) Überlegungen gelöst. 
Die Auswahl des geeigneten Modells kann auch experimentell auf der Grundlage 
einer vorbereitenden kleinen Stichprobe erfolgen. Ein solches Herangehen wird 
in einer Arbeit von FroLow und TscHENnzow [2] untersucht. 

Es scheint, als ob in Zukunft eine Reduktion des Problems erreicht wird, indem 
man die besonders schlechten (unzulässigen) Modelle in einer Klasse von Modellen 
wegläßt. Gegenwärtig ist es aber schwierig, diesen Standpunkt weiter zu ent- 
wickeln, weil konkrete Resultate noch fehlen. 


$3. Einige Anwendungen 


1. Die Integralgleiehung des Strahlendurehgangs und deren unmittelbare Model- 
lierung. Wir wenden uns jetzt wieder der Aufgabe des Strahlendurchgangs durch 
Materie zu und betrachten diese Aufgabe vom Standpunkt der Resultate, die in 
diesem Kapitel dargestellt worden sind. Dem im dritten Kapitel beschriebenen 
Modell entspricht offensichtlich ein Markoffscher Zufallsprozeß, der homogen in 
der Zeit ist. Dabei sind die Bewegungen der Teilchen im Phasenraum der Lage- 
und Geschwindigkeitskoordinaten voneinander unabhängig und identisch verteilt. 
Andererseits kann der Prozeß des Strahlendurchgangs durch eine Integrodifferen- 
tialgleichung (die Gleichung des Durchgangs) beschrieben werden, die ihrerseits 
in eine Integralgleichung übergeführt werden kann. Diese letzte wird uns haupt- 
sächlich interessieren, weil sie eine Gegenüberstellung der unmittelbaren Model- 
lierung mit den Lösungsmethoden für Integralgleichungen ermöglicht. Wenn man 
beachtet, daß die Energie des Teilchens eindeutig mit dem Betrag der Geschwin- 
digkeit in Beziehung steht, dann kann man, wo das günstig ist, anstelle von E 
und 2 auch den Geschwindigkeitsvektor ® des Teilchens betrachten. Wir be- 
zeichnen mit «(f,r,®) die Dichte der Teilchenanzahl, die im Punkt r mit der 
Geschwindigkeit ® zur Zeit # auftritt. Wird die Funktion w so normiert, daß das 
Integral von « über den Phasenraum der Veränderlichen & = (t, r, v) gleich Eins 
wird, dann kann % auch als Wahrscheinlichkeitsdichte der Teilchen zur Zeit 
im Punkt r mit der Geschwindigkeit ® gedeutet werden. 

Die Integrodifferentialgleichung des Durchgangs hat für die Funktion u(t, r, ®) 
die Gestalt (FRoLow und TScHENZzoWw [3]) 


ou 
GE + (v. grad u) 
— HE) — |v] Zr, |e)) w + [©] Esır(r, ©’) Klo’, ©, r) ul, r, dv) dv’ 
+ SFr, ©) |O| Ferlr, ||) Kz(v’, vd, r) ua) dv’. (6.3.1) 
(v) 


Dabei ist &(r, |v]) der vollständige makroskopische Wechselwirkungsquerschnitt, 
Zst der makroskopische Streuquerschnitt und Zy.,, der makroskopische Zerfalls- 
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querschnitt; » ist die mittlere Anzahl der beim Zerfall gebildeten neuen Teilchen; 
K,(v’,v, r) ist die Wahrscheinlichkeitsdichte dafür, daß sich bei der Streuung 
die Geschwindigkeit von ®’ auf ® ändert (Streuungsindikatrix); K,(v’, ®, r) ist 
die Wahrscheinlichkeitsdichte dafür, daß durch den Zerfall eines Teilchens mit 
der Geschwindigkeit ®’ ein Teilchen mit der Geschwindigkeit ® entsteht; f(a) ist 
die Teilehendichte der Quelle. 

Zur Vereinfachung der Darstellung werden wir nur den stationären Fall du/dt = 0 
mit fehlendem Zerfall, also Iyerr = 0, ausführlich betrachten. Besonders lehrreich 
ist dabei die Untersuchung des schon ausführlich beschriebenen Durchgangs von 
y-Quanten durch Materie. Für den auch im dritten Kapitel betrachteten Kern- 
kaskadenprozeß kann in analoger Weise eine Stoßgleichung der Gestalt (6.3.1) 
formuliert werden, aber wir werden diesen Prozeß in Verbindung mit der Stoß- 
gleichung nicht weiter betrachten. Die (6.3.1) entsprechende Integralgleichung 
hat die Gestalt 


pe) = / Ku x) ey) dy + Fa). (6.3.2) 


Dabei ist p(a) die Dichte der Teilchenwechselwirkung mit der Materie im Punkt 
x = (r,v) des Phasenraumes; KX(y, x) ist die Wahrscheinlichkeitsdichte dafür, 
daß das Teilchen im Punkt x eine Wechselwirkung erleidet, nachdem eine Wechsel- 
wirkung im Punkt y = (r’, v’) erfolgte; f(a) ist die Dichte der Wechselwirkung 
von Teilchen, die unmittelbar aus der Quelle kommen. 

Die physikalische Bedeutung der Integralgleichung (6.3.2) ist hinreichend klar. 
Sie gibt an, wie sich die Wechselwirkungsdichte im Punkt & aus der durch die 
Quelle hervorgerufenen Dichte und aus der Wechselwirkungsdichte im ganzen 
Phasenraum AR x V zusammensetzt, wobei der Übergang des Teilchens von einem 
beliebigen Punkt y in den Punkt x mit der Wahrscheinlichkeitsdichte K(y, &) 
erfolgt. Die Äquivalenz der Gleichungen (6.3.1) und (6.3.2) kann unter sehr 
allgemeinen Voraussetzungen über die vorkommenden Funktionen gezeigt werden. 
Die formale Umformung von (6.3.1) in (6.3.2) kann mit Hilfe der Laplacetransfor- 
mation durchgeführt werden. 

Der Kern K(y,&) der Gleichung (6.3.2) wird in der Regel substochastisch sein, 
d.h., es gilt 


S Kiy, x) de = 1 — g(y) mit 0<gWy)<I1. 
RxV 


Die Absorptionswahrscheinlichkeit für das Teilchen beträgt also g(y). Dieses 
Verschwinden des Teilchens kann verschiedene physikalische Ursachen haben; 
etwa Teilcheneinfang durch einen Kern des Stoffes oder Verlassen der Grenzen 
des stofferfüllten Körpers (in das Vakuum). Für die Aufgaben der Strahlen- 
wechselwirkung stellt außerdem der Kern bei festem y% die Dichte eines verall- 
gemeinerten Maßes dar, und die Integraloperatoren wirken im allgemeinen in 
Räumen verallgemeinerter Funktionen. Alle Resultate von $2 kann man auf 
diesen Fall erweitern, eine ausführliche Darlegung würde aber zu weit führen. 
Weil wir uns hier nicht speziell mit Aufgaben des Strahlentransports beschäftigen, 
verzichten wir auf eine Begründung dieses Problems. Für den Fall des Durch- 
gangs von y-Quanten durch Materie schreibt man den Kern der Integralgleichung 
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(6.3.2) gewöhnlich in der Form 


Ki, x) — un Hy R)A— A-1400) 


„Ze exp (1.2), (e nr (6.3.3) 
Ir — r/]2 res e 


Dabei ist o.(y > x) 6(4 — 7’ — 1+ 22’) = K,(y, &) die Indikatrix der Compton- 
streuung; A ist die dimensionslose Wellenlänge der y-Quanten, die mit der in 
Elektronenvolt gemessenen Energie durch die Beziehung A = mc?/E zusammen- 
hängt (m Ruhemasse des Elektrons, ce Lichtgeschwindigkeit). Im Fall der y-Quan- 
ten empfiehlt es sich, anstelle der Energie E die Wellenlänge } zu betrachten. Die 
Größe r(y, &) nennt man optische Länge zwischen den Punkten y und &. Sie wird 
durch die Gleichung 


ae Ders (6.3.4) 
0 


bestimmt. (x) bezeichnet die Diracsche ö-Funktion, d.h. die durch die Be- 
ziehung 


jr Öle — &) de = f(&o) 


für alle finiten Funktionen f(a) definierte verallgemeinerte Funktion. Das Auf- 
treten der ersten 6-Funktion im Kern der Gleichung bedeutet, daß die Wellen- 
länge } der y-Quanten nach der Streuung eindeutig durch die Bewegungsrichtung 
nach Streuung bestimmt ist (vgl. (3.1.1)). Die zweite ö-Funktion bedeutet, daß 
die Integration über 2 entartet und daß sich als Ergebnis der Wert des Inte- 
granden auf der Verbindungslinie zwischen » und r’ ergibt. 

Führen wir nun noch die Beziehung 


Ku, a) =) r Be 2) 5 (a - 7) (6.3.5) 
ein, so gilt 
Ky,&) = Er K,(y, x) K,(y, &). (6.3.6) 


Die Streuungsindikatrix K,(y, &) hängt nicht von der Veränderlichen r’ ab, und 
K,(y, &) hängt nicht von den Veränderlichen 4’ und 2’ ab. 

Beim Übergang zu Polarkoordinaten mit dem Ursprung in r’ vereinfacht sich 
die Gestalt des Kernes. Günstigerweise wählt man als neue Ortskoordinaten 
i=|r—r|, a= cosd= (2,@’) und den Azimutwinkelg. Die Funktional- 
determinante dieser Abbildung hat mit diesen Bezeichnungen den Wert 1? du do. 
Es gelten dann folgende Beziehungen (Normierungsbedingungen): 


Ken für 9S2, 


Il ı » 
F auf 7 K,ya)d=1 mit Mei _ 1 für >92 
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(vgl. (3.1.3)) und 
f E®) exp (— r(y,&)) dt = 1 (6.3.7) 
0 


(vgl. (3.1.1)). Die letzte Gleichung hat folgende Bedeutung: Wenn r = (x, y, 2) 
einen beliebigen Wert annehmen kann (also -— ww <xz<w, -w<y<o, 
— © <2< oo), dann ist K,(y, ®) für beliebige A, u und p bezüglich & auf Eins 
normiert. 

Ist also das Gebiet, in dem die Bewegung der y-Quanten vor sich geht, der 
dreidimensionale euklidische Raum über der Variablen r und gilt (a2) > 0 für 
alle &, dann genügt der Kern K(y, &) der Beziehung 


Zstr(Y) Zuns(y) - 
Kay 3 = —=-1-— — | fl 
a zw” 

wobei 2); der Absorptionsquerschnitt der Teilchen ist. In diesem Fall kann man 
als Dichte p(y — x) der Übergangswahrscheinlichkeit des Markoffschen Prozesses 
den Kern K(y,&) wählen. Dann ist g(y) = &uns( (yizy) ) die Wahrscheinlichkeit 
für die physikalische Absorption des Teilchens im Punkt y. Ist das Maß der 
Menge jener 2 ungleich Null, für die Er’ + 19,7) mit 2>a>0 (a fest) und 
beliebigen »’ und A verschwindet (das gilt beispielsweise im Fall eines räumlich be- 
schränkten Variabilitätsbereiches von r), dann kann das Teilchen das Gebiet 
verlassen, und die Wahrscheinlichkeit seiner Rückkehr kann Null sein. Diese 
Erscheinung nennt man Abfluß aus dem Gebiet. Ein solcher Zustand, bei dem 
das Teilchen unwiderruflich das Gebiet verläßt, stellt auch einen absorbierenden 
Zustand dar. Daher ist im allgemeinen Fall g(y) gleich der (physikalischen) Ab- 
sorptionswahrscheinlichkeit im Punkt y vermehrt um die Wahrscheinlichkeit da- 
für, daß sich der Punkt y außerhalb des Gebiets A befindet. In beiden Fällen 
ist leicht zu sehen, daß die Wahl von K(y, &) als Dichte p(y — x) zu der schon 
im dritten Kapitel beschriebenen unmittelbaren physikalischen Modellierung führt. 
Der Einfachheit halber nehmen wir weiterhin an, daß das Gebiet, in dem 2(#) 
ungleich Null ist, konvex ist. Dann ist g(y) für solche y, für die die räumliche 
Komponente von r zu % gehört, gleich Isı.(y)/&(y) und gleich Eins, wenn r 
„ außerhalb des Gebietes R liegt. Man sieht leicht, daß bei der Berechnung der 
Austrittswahrscheinlichkeit eines Teilchens aus dem Gebiet # die Beziehung 
h(&) = öl — s) gilt, wobei s zum Rand von AR gehört. Wenn &(#) bei hinreichend 
großem |r| für eine Menge 2 positiven Maßes bei einem festen Ursprung der 
Polarkoordinaten verschwindet, dann fallen die Schätzungen ER und dr zusammen. 
In der Tat ist g; in diesem Fall gleich Eins, und es gilt R? nn N AR wenn die Tra- 
jektorie bei Austritt, des Teilchens aus dem Gebiet abgebrochen wird, und g; ist 
gleich Null im entgegengesetzten Fall. 


2. Einfachste Beispiele „fiktiver‘ Modelle. Wählt man für »p(y— x) eine von 
K(y, &) verschiedene Funktion und für z(&) eine von f verschiedene Funktion, 
so wird das durch die Markoffsche Kette {r, p} beschriebene -Modell im allge- 
meinen nicht dem physikalischen Bild der Strahlung entsprechen. Unter be- 
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stimmten Bedingungen (den Bedingungen (6.2.6)), die in diesem Fall die Absolut- 
stetigkeit des durch {f, X} induzierten Maßes in bezug auf. das durch {, p} 
induzierte Maß bedeuten, können jedoch erwartungstreue Schätzungen beliebiger 
Mittelwerte über den Trajektorien des realen Prozesses konstruiert werden. Wir 
geben nun einige einfache Beispiele für die Konstruktion solcher fiktiven Mo- 
delle an. 


a) Berechnung der physikalischen Absorptionswahrscheinlichkeit mit Hilfe sta- 
tistischer Gewichte. Wenn uns die Austrittswahrscheinlichkeit aus einem Gebiet A 
interessiert, dessen Ausmaße so sind, daß im Mittel mehrere Wechselwirkungen 
des Teilchens mit dem Stoff vor seinem Austritt aus den Grenzen von erfolgen, 
und wenn die Größe st/2' klein ist, dann wird der Austritt eines Teilchens aus 
A ein seltenes Ereignis sein, und die Dispersion der Schätzung kann sehr groß 
sein. Als Übergangswahrscheinlichkeit wählt man in diesem Fall zweekmäßiger- 
weise 

(y) 


Puzm=z Run. 


Dabei wird die Trajektorie des fiktiven Teilchens offensichtlich nieht innerhalb 
des Gebietes abbrechen, sondern wird immer durch Austritt aus dem Gebiet 
enden. Wegen (6.2.11) ist g,:+1 = Zsır(&,)/2(®:). Das Teilchen wird nicht ab- 
sorbiert, aber sein „Gewicht“ nimmt von Zusammenstoß zu Zusammenstoß ab. 
Dieses Verfahren vergrößert die Anzahl der austretenden Teilchen und verkleinert 
die Dispersion der Zufallsgröße, die die Austrittswahrscheinlichkeit schätzt. 

b) Es sei nun A eine Schicht von geringer Dicke, die Quelle liege im Innern 
und die Strahlung erfolgte vollständig oder größtenteils normal zur Oberfläche 
der Schicht. Uns interessiert der Anteil von Teilchen, die die Schicht ver- 
lassen, nachdem sie wenigstens einmal gestreut wurden. Die überwiegende Anzahl 
der Teilchen verläßt die Schicht ohne jede Wechselwirkung mit dem Stoff, d. h., 
die meisten Teilchengeschichten werden von uns nutzlos verfolgt. Die Wahr- 
scheinlichkeit, daß ein Teilchen, das aus dem Punkt y stammt und die Bewegungs- 
richtung @ hat, die Schicht ohne Wechselwirkung verläßt, beträgt 


aly) 
a = er(-/ 2 + M.H a). 


Dabei ist a(y) der Abstand vom Punkt y bis zur Grenze der Platte. Wir setzen 


KW, ®) 

— 2) = ———. 6.3.8 
PITM)-T_ ug (6.3.8) 
Dann verläßt das Teilchen niemals die Schicht, und der uns interessierende Anteil 
der Teilchen, die wenigstens einmal gestreut werden, kann genauer geschätzt 
werden, Ein Abbrechen der Trajektorie ist nur möglich als Folge einer physi- 
kalischen Absorption. Das Gewicht des Teilchens wird durch die Größen g;,.:+1 
—=1-—g(#;) bestimmt. Die Weglänge des Teilchens wird nicht so wie bei der direkten 
Modellierung berechnet. In Übereinstimmung mit (6.3.8) ist nämlich die Weg- 
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länge l; von r, bis r;_, mit der Dichte 


1 
Ir; En 2, A) eXp (-; fEir, + iQ,, 2) a) 


x ( z exp (-. FE HERE) a) 


verteilt. Wenn 2% innerhalb der Schicht nicht von r abhängt, erhalten wir für 
!; den Ausdruck 


n 
= 5108 [1 —a(l- exp (— Zax,)))]- (6.3.9) 

Wie leicht zu sehen ist, vergrößert die beschriebene Methode den Rechen- 
aufwand bei der Modellierung der Trajektorien, weil die Berechnung des Ab- 
standes bis zur Grenze in jedem Schritt und die Berechnung der in (6.3.9) und 
in den Q” eingehenden Exponentialfunktion erforderlich ist. Bei einer wirk- 
lichen Rechnung muß man diesen Umstand beachten. Besonders aufwendig wird 
die Rechnung, wenn 2 von r abhängt und als Gebiet R keine Platte, sondern 
ein Gebiet komplizierterer Form gewählt wird. 

Wählt man für die Dichte p(y— x) die Funkion 

K(y, ©) 2(y) 


Lsuly) (1 a)’ 


so ist g(y) = 0, alle Trajektorien sind unendlich, und man muß sie solange ver- 
folgen, bis die Größe Q\” vernachlässigbar klein wird. 


Zur Dispersionsverkleinerung bei Schätzungen von Funktionalen in Aufgaben 
der behandelten Art werden oft Informationen über die Lösung der adjungierten 
Gleichung benutzt. Die Grundlage dafür bilden die allgemeinen Überlegungen, 
die im vorigen Paragraphen dargestellt wurden. In einigen Fällen gelingt es, 
für einfachere Aufgaben die adjungierte Gleichung analytisch zu lösen, beispiels- 
weise in einfachen Gebieten unter der Voraussetzung konstanter Wirkungsquer- 
schnitte und anderer vereinfachender Annahmen. Man kann versuchen, die auf 
diese Weise gewonnene Lösung zur Dispersionsverkleinerung zu benutzen. Der 
Effekt wird gewöhnlich experimentell durch Schätzung der Dispersion auf Grund 
einer Stichprobe mäßigen Umfangs überprüft. 

Man kann aber auch wie in Kap. IV, $5, von einem anderen Standpunkt aus- 
gehen und eine positive von m Parametern abhängige Funktion Hz, 14, -.., @m) 
vorgeben. Die Dichte p(y —x) der Übergangswahrscheinlichkeit wird dann in 
der Form 

K(y. ©) dy, a1, +, Am) 
29 MR, Ay +, Am) 


gewählt. Dabei muß offensichtlich die Ungleichung 


MR, Ay ++, Am) — My,Q5 +, Am) 
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für alle Werte a,, ..., @„ einer gewissen Menge erfüllt sein. Bei einer komplizierten 
Gestalt des Kernes K(y, &) kann diese Forderung schwerwiegend sein. Für die 
Schätzung 54 ist bekannt, daß die Dispersion für eine Übergangsdichte geeigneter 
Gestalt verschwindet. Daher kann man die Aufgabe nach einer solchen Wahl 
der Parameter a,, ..., 4m stellen, daß die Dispersion von N minimal wird. Ein 
Erfolg hängt hier viel von der geschickten Wahl der Funktion 9 ab. Die Größen 
@4s +.., &m kann man auch durch das Bestimmen einer Näherungslösung der ad- 
jungierten Gleichung in der Gestalt #(&, @,, ..., @„) schätzen. Dazu ist es sinn- 
voll, Variationsmethoden zu benutzen. Freilich gibt es noch andere Verfahren, 


Parameter in die Dichte (und damit in die Größen am) einzuführen. Eine weit- 
verbreitete Methode stellt die Exponentialtransformation dar (Fano u.a. [1], 
MicHATLow [3]), auf die wir nicht näher eingehen. Besonders wichtig ist es, 
Methoden der Dispersionsverkleinerung bei der Berechnung kleiner Wahrschein- 
lichkeiten mit der Monte-Carlo-Methode auszuarbeiten, beispielsweise die Wahr- 
scheinlichkeit, daß y-Quanten in ein kleines Gebiet des Phasenraumes fallen, oder 
die Wahrscheinlichkeit, daß eine dicke Schicht durchstrahlt wird, wenn die Strah- 
lung um eine Größenordnung von 10”? abgeschwächt wird. In diesem letzten Fall 
erreicht bei unmittelbarer Modellierung von 10? Teilchen im Mittel nur eines die 
Grenze des Gebietes, und der Rechenaufwand zur Erzielung eines unmittelbaren 
Resultates wird außerordentlich groß. 

Als ein Grenzfall ergibt sich der Fall, daß die Strahlung in einem Punkt des 
Raumes # zu berechnen ist. Die Wahrscheinlichkeit, daß ein Teilchen einen be- 
stimmten Punkt des Raumes berührt, ist offensichtlich gleich Null, und die Me- 
thoden der unmittelbaren Modellierung werden unwirksam. Es gibt aber spezielle 
Verfahren, die eine Lösung auch dieser Aufgabe ermöglichen. 


3. Lokale Methoden. Das anschließend zu beschreibende Verfahren kann bei 
der Lösung beliebiger Integralgleichungen Anwendung finden. Für die Gleichung 
des Strahlentransports besitzt es allerdings gewisse Besonderheiten, die mit der 
konkreten Gestalt des Kernes zusammenhängen. Das Verfahren arbeitet folgender- 
maßen. Aus (6.2.1) folgt 


pa) = S K(y, 2°) poly) dy + Fa) 
mit einem festen Punkt x° aus Rx ®. Zur Berechnung der Größe f K(y, &°) 


p(y) dy kann eine beliebige erwartungstreue Schätzung (z. B. J, oder J,) benutzt 
werden, wenn man h(2) = K(&, &°) setzt. Die Berechnung von f(a°) bereitet keine 
Schwierigkeiten. So kann man den Wert der Lösung der Integralgleichung in 
einem festen Punkt &° schätzen. Für die Gleichung des Strahlentransports ist 
dazu die Wechselwirkungsdichte mit dem Stoff im Punkt x" zu schätzen. Die 
Strahlung, die als Lösung der Integrodifferentialgleichung erscheint, ist in ein- 
facher Weise mit @(x°) verknüpft. (Bei der Berechnung der Strahlung muß man 
h(x2) = K(®, x°)/sı(@) wählen.) Leider hat der Kern K(y,&) der Strahlen- 
transportgleichung starke Singularitäten, wie etwa das Auftreten der ö-Funktion 
oder der Größe |r — r’|* im Nenner. Die letzte Singularität führt dazu, daß die 
Dispersion der Schätzungen RA J, und anderer Schätzungen unendlich wird, wenn 
der Punkt r® innerhalb des Gebietes von R liegt, wo X > 0 ist. Spezielle Ver- 
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fahren, die die Herleitung von Schätzungen mit endlicher Dispersion ermöglichen, 
sind in numerischer Hinsicht recht aufwendig (ein solches Verfahren beschreiben 
wir anschließend). Daher benutzt man für eine grobe Schätzung der Strahlung 
manchmal die Schätzungen J, und J, mit ha) = Ka, 20)/Eyı.(@), d.h. das 
Schema B entsprechend der Einteilung von Kap. II, $3. Die Konvergenzordnung 
beträgt‘dabei O(N -!/3), und es gelten alle Überlegungen, die früher im Zusammen- 
hang mit dem Schema B gemacht wurden. 

Eines der Verfahren, das die Herleitung einer Schätzung mit endlicher Dis- 
persion ermöglicht (KAaros [1]), besteht in folgendem: Zur Schätzung der Größe 
S Kia, ©) p(a)/Fsı(@) de wird eine spezielle Verteilung des Punktes x gewählt 
(die Singularität wird in der Dichte berücksichtigt). So kann für die Berechnung 
des Beitrages beim Übergang von x, zu &, die Verteilungsdichte 


= u Ir, — r'] 
Ua, —2)= Tlr)=(C eu ‚ 
( fi} 1) ( 1) Ir, er 7,2 Ir, _ (2 


gewählt werden. Analog wird im allgemeinen Fall die Trajektorie , >, — '" — &% 
verfolgt, die einer Wahrscheinlichkeitsdichte 


() PR, > %)  DRr-2 — %r-ı) Üer-ı > 8) 
entspricht. Obwohl die Kette nicht homogen ist, prüft man leicht, daß mit 
I) KR 8)  Kni-» 8-1) Kin) 
er) PR >) Pia >Li-ı) Ux;-ı —%;) 


ı = 


die Schätzungen J, und J, erwartungstreu sind. Dabei enthält g; den Faktor 
jr; — rP]?, und die Schätzungen J und J, für f K(y, x°) @(y)/N str (y) dy enthalten 
im Nenner nicht mehr die Größe |r; — r|?. Jedoch enthält der Nenner die Größe 
Ir;—ı — r'| (aus dem Zähler von U), aber das zweite Moment der Schätzung ist 
schon endlich. Es bleibt zu bemerken, daß das dritte und die höheren Momente 
der Schätzung nicht existieren, so daß die Konvergenz der Verteilung der Schätzung 
gegen die Normalverteilung sehr langsam erfolgt. Die gewöhnliche Schätzung der 
Dispersion (1.3.5) ist recht ungenau, und die Herleitung eines Konfidenzintervalls 
auf Grund der Normalverteilung ist nicht gerechtfertigt. Man kann kompliziertere 
Verfahren angeben, die die Endlichkeit des dritten und der höheren Momente der 
Verteilung der Schätzung sichern. Möglich ist aber auch die Wahl einer anderen 
Dichte U. Eine Untersuchung dieser Probleme findet man in der Spezialliteratur 
(z. B. Karos [1], ErmaXow u.a. [1], Cuissanuroinow [1]. Ist der Teilchenstrom 
in einer hinreichend großen Umgebung von r° durch eine glatte Funktion darstellbar, 
kann man folgendermaßen vorgehen. Wieim fünften Kapitel beschrieben, werden 
die Fourierkoeffizienten des Teilchenstromes als Funktion von r? berechnet. Dann 
wird der Wert der Fourierreihenteilsumme für den Teilchenstrom im Punkt r° be- 
rechnet, und dieser Wert anstelle des gesuchten benutzt. Diese Methode benötigt 
eine strenge theoretische Begründung, obwohl auch die empirische Schätzung der 
Fehler des Resultats möglich ist. Der Vorteil der beschriebenen Berechnungs- 
methode ist offensichtlich, weil die Änderungen im Modellierungsprogramm der 
Trajektorien unbedeutend sind. Es besteht nur ein größerer Speicherbedarf für 
das Auflaufen der Summen, mit denen die Fourierkoeffizienten geschätzt werden. 
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Dieser letzte Umstand ist auch nur dann wesentlich, wenn die Energie- oder 
Winkelverteilung des Teilchenstromes in einem Punkt in Gestalt eines Histo- 
gramms oder durch die Fourierkoeffizienten nach einem Funktionensystem he- 
rechnet werden. Der zusätzliche Speicherbedarf kann dann beträchtlich sein. 
Schließlich kann man zur Bestimmung des Teilchenstromes in einem Punkt 
die adjungierte Gleichung benutzen. Das allgemeine Vorgehen im Fall der adjun- 
gierten Gleichung bleibt natürlich gegenüber dem bisherigen ungeändert, obwohl 
es einige besondere Details in numerischer Hinsicht gibt. Vor allem ist folgendes 
zu bemerken: Spielt /(®@) in Gleichung (6.3.1) die Rolle einer Strahlenquelle,. so 
spielt A(#) die Rolle eines Empfängers, der die ankommenden Teilchen registriert. 
Bei der Lösung der adjungierten Gleichung vertauschen sich die Rollen von f{#) 
und A(&) (es wird angenommen, daß A(a) nichtnegativ und normiert ist). Die 
Wahrscheinlichkeit, daß ein Teilchen im Punkt & erzeugt wird, ist mit der Dichte 
h(&) verteilt. Nachdem das Teilchen mit gewissen Übergangswahrscheinlichkeiten 
in neue Punkte übergeht, wird es in Empfängern registriert, die mit der Dichte 
f{a) verteilt sind. Die direkte (primale) Aufgabe mit punktförmiger Quelle aber 
ausgedehntem Empfänger (h(&) ist in einem größeren Gebiet des Phasenraumes 
ungleich Null) bietet bei der Lösung keine besonderen Schwierigkeiten. Ist aber 
der Empfänger in einem Punkt konzentriert, dann gibt es Schwierigkeiten, über 
die anschließend zu sprechen sein wird. Für die adjungierte Gleichung gilt ent- 
gegengesetztes Verhalten. Daher ist es zweckmäßig, bei Aufgaben, in denen f(x) 
in einem größeren Gebiet nicht verschwindet, aber h(x#) nur in einem kleinen Gebiet 
des Phasenraumes ebenfalls nicht verschwindet, zur Berechnung des Funktionals 
(h,@) = (f,$*) die adjungierte Gleichung zu lösen. Bestimmte Schwierigkeiten 
ergeben sich dabei aus folgendem Grund. Der Kern K(x, y) hat hier keinen unmit- 
telbaren physikalischen Sinn, und das Integral / K(x, y) dy kann größer als Eins 
‚sein. Eine ausführliche Beschreibung der Lösungsverfahren für die adjungierte 
Gleichung findet man in den Arbeiten von Karos [2] und Chissamurvınow [2]. 


4. Eine allgemeine Bemerkung zur Lösung der Stoßgleichungen. Der Durchgang 
von y-Quanten durch Materie bildet ein verhältnismäßig einfaches aber typisches 
Beispiel für diesen Aufgabentyp. Die Aufgabe für die Neutronenstrahlung ist'in 
rechnerischer Hinsicht komplizierter (falls nicht wesentliche Vereinfachungen des 
physikalischen Sachverhalts vorgenommen werden). Aber fast alle numerischen 
Verfahren, die im Fall der y-Quanten benutzt werden, können auch im Fall der 
Neutronen Anwendung finden. Die vorangegangene Beschreibung der grundlegen- 
den Besonderheiten bei Aufgaben der Teilchenstrahlung ist verhältnismäßig ein- 
fach gehalten und sollte keine Illusionen hervorrufen. Die realen Aufgaben sind 
sowohl in. bezug auf die Lage der räumlichen Gebiete zueinander als auch in bezug 
auf die zu berücksichtigenden physikalischen Effekte recht kompliziert. Die Aus- 
wahl eines Modells erfordert bei realen Aufgaben ernsthafte theoretische Unter- 
suchungen und vorbereitende Experimente an kleinen Stichproben. Aufgaben der 
Reaktorberechnung wurden von uns nicht berührt. Dort spielt der Teilchenzerfall 
eine wesentliche Rolle, und man muß die Eigenschaften der stationären Verteilung 
des Markoffschen Prozesses bestimmen. Eine ausführliche Darstellung aller dieser 
Fragen würde wesentlich mehr Kenntnisse in der Reaktorphysik erfordern, als 
sie in diesem Buch enthalten sind. Außerhalb unserer Betrachtung bleiben auch 
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viele Methoden der Dispersionsverkleinerung, die in allgemeiner Form im vorigen 
Paragraphen dargestellt wurden, deren konkrete Anwendung auf die Gleichungen 
der Teilchenstrahlung aber nicht immer trivial ist. Wir kommen nun zur Darstel- 
lung eines Beispiels für die Modellierung einer Markoffschen Kette zur Lösung von 
Aufgaben der statistischen Physik. 


5. Modellierung einer Markofischen Kette in Zusammenhang mit Aufgaben der 
statistischen Physik. Es wird ein System von N einatomigen Teilchen betrachtet. 
Wir bezeichnen mit r; die Lage des Schwerpunkts und mit ®, die Geschwindigkeit 
des i-ten Teilchens, ? = 1, ..., N. Eine Menge r,, %,, ..., !y, ®y nennen wir Zustand 
des Systems. Die Hamiltonfunktion Z(r,, %,, ..., ?y, &x) ist die Summe von kine- 
tischer und potentieller Energie: 


N 
= mv} 4 
Hr,v. stm tn) SD ——H+ Ultron Pr) 
i=1 


2 
(m Masse des Teilchens). Wir machen nun die vereinfachende Annahme, daß die 
potentielle Energie durch die paarweise Wechselwirkung bestimmt wird: 


Ute rn)= EZ Ol —rj), 
\ = 
wobei ® eine gegebene Funktion ist. Aus der statistischen Physik ist bekannt, 
daß bei genügend großem N für die Wahrscheinlichkeitsdichte des Zustandes 
1: 9%, +, m Ur 


ay exp [- = Hor,t.s ty en! (6.3.10) 


gilt. Dabei ist @«, eine Normierungskonstante, k eine Konstante, und 7 kann als 
Temperatur gedeutet werden. Weil v; nur in den Ausdruck für die kinetische 
Energie eingeht und dieser verhältnismäßig einfach ist, kann man (6.3.10) nach 
allen ©; analytisch integrieren und erhält so die Dichte für die Aufenthaltswahr- 
scheinlichkeit in den Punkten r,, ..., #y in der Form 


e 1 ne 
N exp I- m Vor „Pral. (6.3.11) 


Dabei ist b, (das sogenannte Lageintegral) eine Normierungskonstante. Die Größe 
@y kann durch by ausgedrückt werden. Verschiedene thermodynamische Größen 
wie Druck, Entropie u. a. können durch die partiellen Ableitungen von ay ausge- 
drückt werden, d. h. durch Mittelwerte der Gestalt 


F_ PEIUE „Pn) exp I— FF /kT} m dry 
Sexp {— V/kT} dr, -- 


Unsere Aufgabe besteht daher in der Berechnung von F bei einem gegebenen F. 
Wir zerlegen dazu den ganzen Raum in Würfel mit hinreichend großer Seitenlänge 
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und werden annehmen, daß die Aufgabe in bezug auf die Seitenflächen des Würfels 
symmetrisch ist (wenn das Teilchen irgendeine Fläche schneidet und aus dem Wür- 
fel anstritt, taucht es automatisch auf der entgegengesetzten Seite auf). Inner- 
halb des Würfels wird nun ein Netz mit kleiner Schrittweite konstruiert, und es 
wird angenommen, daß sich das Teilchen nur in den Knoten des Netzes befinden 
kann. Alle Knoten werden der Reihe nach durchnumeriert j = 1, ..., 2, und man 
kann nun annehmen, daß 


gilt. Nun bildet man eine Markoffsche Kette mit den stationären Wahrscheinlich- 
keiten 


. R 
9; = by exp I- za 


Dazu muß man als Elemente der stochastischen Matrix solchs p,,; wählen, die die 
Bedingung 


" 


z pP, = N (6.3.12) 
j= 


erfüllen, d. h., es verlassen genau so viele Teilchen den Punkt mit dem Index j 
wie dann von anderen Punkten in den Punkt 7 kommen. Die Aufgabe ist insbe- 
sondere dann gelöst, wenn die Gleichgewichtsbedingung 


IP, = NıPı,i (6.3.13) 


gilt. Wenn man (6.3.13) über j summiert, dann erhält man offensichtlich (6.3.12), 
Gilt daher 


v, v, 
Pi, eXp ET = Pı,j Xp ETl’ 


so ist (6.3.12) erfüllt. Weiter verfährt man num,so: Man wählt einen Punkt des 
Netzes mit dem Index ! und bringt dort ein Teilchen an. Mit der gleichen Wahr- 
scheinlichkeit wählt man einen anderen Punkt mit dem Index 7 und berechnet die 
ihm entsprechende potentielle Energie. Ist U,< U,, so vollzieht sich ein voll- 
ständiger Übergang von j nach I. Gilt aber U, > U,, dann vollzieht sich der 
Übergang in den !-ten Punkt mit der Wahrscheinlichkeit exp {— (U, — U,)/kT}, 
d.h. falls x > exp {— (U, — U,)/kT'} für den Stichprobenwert & gilt. Mit der 
Komplementärwahrscheinlichkeit findet kein Übergang statt, d. h., das Teilchen 
bleibt am Ort. Wegen der Symmetrie eines solehen Verfahrens (alle Teilchen wer- 
den der Reihe nach so behandelt) ist (6.3.12) erfüllt. Das arithmetische Mittel 
von F über alle Lagen liefert die gewünschte Schätzung. Die Parameter der 
zufälligen Verschiebung müssen entsprechend den physikalischen Eigenschaften 
des Stoffes gewählt werden, klein für Kristalle, größer für Flüssigkeiten und noch 
größer für Gase. Ausführlich werden diese Fragen von Fis#er [1] untersucht. 
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$4. Bemerkungen über die Lösung anderer Aufgaben 
der numerischen Mathematik 


1. Differentialgleichungen. Die prinzipielle Möglichkeit zur Lösung von Diffe- 
rentialgleichungen mit der Monte-Carlo-Methode ergibt sich aus den Resultaten 
von $1. Nachdem man ein Netz mit genügend kleiner Schrittweite konstruiert 
hat und so die Differentialgleichung mit hinreichender Genauigkeit durch ein 
lineares algebraisches Gleichungssystem ersetzt hat, ist es leicht, die Modellierung 
durch eine Markoffsche Kette anzuwenden. Aber in diesem wie auch in vielen 
anderen Fällen bedeutet eine einfache Herleitung des stochastischen Modells noch 
nicht seine Effektivität in numerischer Hinsicht. Das Verfolgen der Irrfahrt auf 
einem Netz mit kleiner Schrittweite kann aufwendiger sein als die Lösung des 
Gleichungssystems mit anderen Methoden (z. B. durch sukzessive Approximation). 
Daher ist es wichtig, verschiedene andere stochastische Modelle für Differential- 
gleichungen zu untersuchen. Es gibt ziemlich viele Modelle solcher Art (z.B. 
MÜLLER [1], Dsapkın und SuukowaA [1], Dyskın und JuUscHk#wItschH [1]). In 
den meisten Fällen werden die Differentialgleichungen zur Lösung theoretischer 
Probleme benutzt, die mit zufälligen Prozessen verknüpft sind, aber seltener sind 
numerische Gesichtspunkte ausgearbeitet. Wir beschränken uns daher nur auf 
einige Bemerkungen über den Zusammenhang zwischen Differentialgleichungen 
und stochastischen Modellen. 

Vor allem ist zu bemerken, daß man. die Lösung des Cauchyproblems für ein 
System gewöhnlicher linearer Differentialgleichungen durch Modellierung eines 
Bedienungssystems erhalten kann. Gut bekannt ist beispielsweise, daß ein Poisson- 
sches System mit exponentialverteilter Bedienungszeit durch ein gewöhnliches 
Ditterentialgleichungssystem mit einer im allgemeinen geraden Anzahl von Unbe- 
kannten beschrieben wird. Ein geschlossenes System, d.h. ein solches, bei dem 
die ausgehenden Forderungen von neuem in das System eintreten, wird durch ein 
System mit m Unbekannten beschrieben, 'wenn die Anzahl der Forderungen im 
System gleich m ist. Die einfachste derartige Differentialgleichung 


vi) = — At) ylt) , I>0, 


ist mit einem Poissonschen Strom der Intensität A(t) verknüpft. Ist y(0) =1, 
so bedeutet y(£) die Wahrscheinlichkeit, daß bis zum Zeitpunkt t kein Ereignis 
eingetreten ist. Übrigens ist die Lösung eines gewöhnlichen linearen Differential- 
gleichungssystems mit nicht zu vielen Unbekannten in der Regel kein kompliziertes 
numerisches Problem, so daß keine Notwendigkeit für die Anwendung der Monte- 
Carlo-Methode besteht. 


Randwertaufgaben sind vom numerischen Standpunkt aus wesentlich inter- 
essanter. Da sich Randwertaufgaben linearer Differentialgleichungen in Fredholm- 
sche oder Volterrasche Integralgleichungen zweiter Art überführen lassen, kann 
auf $3 verwiesen werden. Die Darstellung der Potentialtheorie und der Beweis 
der Äquivalenz von Randwertaufgaben für partielle Differentialgleichungen mit 
den entsprechenden Integralgleichungen findet sich in vielen Lehrbüchern (z. B. 
WLADIMIROW [1]). Es ist aber zu bemerken, daß die Konstruktion der den Kern 
bestimmenden Greenschen Funktion ein kompliziertes Problem sein kann, insbe- 


15 Ermakow, Monte-Carlo-Methode 
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sondere dann, wenn Gleichungen mit veränderlichen Koeffizienten betrachtet 
werden. Daher besteht ein bedeutendes Interesse an anderen Verfahren, die un- 
mittelbar die stochastischen Modelle mit den Differentialgleichungen verbinden, 
sogar wenn sie zu analogen Resultaten führen. Sehr interessant ist in dieser 
Beziehung ein Modell (KAc [2]), das den Poissonschen Prozeß mit der Wellen- 
gleichung verbindet. 

Erfolgreiche Berechnungen wurden hauptsächlich für die Poissonsche Gleichung, 
die Schrödinger-Gleichung und die Wärmeleitungsgleichung durchgeführt (vgl. 
z. B. HAJI-SHEIKH und SpaRRoW [1], D5ADKIN und SuuxowA [1], ELerow und 
Mic#arLow [1]). Eng verknüpft mit diesen Gleichungen sind die Integration nach 
einem Wienerschen Maß und der Prozeß der Brownschen Bewegung. Dieser Zu- 
sammenhang ist für die Wärmeleitungsgleichung leicht zu zeigen, wenn man davon 
ausgeht, daß die Fundamentallösung der Wärmeleitungsgleichung mit der Dichte 
der Normalverteilung übereinstimmt. Entsprechende Resultate für die Schrö- 
dinger-Gleichung findet man in den Arbeiten von Kac [1], Dsakın und SHUKOWwA 
[1] und für die Poissonsche Gleichung bei DynkIn und JUSCHKEWITSCH [1]. 

Der unmittelbare Übergang vom Differenzenschema für die Lösung einer par- 
tiellen Differentialgleichung zu einem Integral über einem Maß in einem Funktio- 
nenraum wird in einer Arbeit von W.J. KryLow [1] betrachtet. 


2. Die Lösung nichtlinearer Probleme mit der Monte-Carlo-Methode wird ge- 
wöhnlich auf die Lösung einer Folge linearer Aufgaben zurückgeführt. So löst 
man beispielsweise die nichtlineare Integralgleichung 


px) = S Kl, y, P(®)) p(y) dy + fi) (6.4.1) 


durch sukzessive Approximation nach dem Schema 


Oz) = S Ka, y,ge-Dy))goly)dy+ia), k=l%... (642). 


Für jedes feste k ist die Gleichung (6.4.2) linear, und sie kann mit einer der früher 
beschriebenen Methoden gelöst werden. Die Konvergenz dieser sukzessiven Appro- 
ximation ebenso wie die Konvergenz der Neumannschen Reihen für jedes & 
werden dabei vorausgesetzt. 

Zu einer Gleichung oder einem System von Gleichungen der Art (6.4.1) kommt 
man beispielsweise bei Aufgaben der Gasdynamik (WALLANDER [1]). Auf diesem 
Gebiet wurde eine große Zahl numerischer Experimente durchgeführt, die zu 
bemerkenswerten Ergebnissen führten (z. B. BoGATscHzwA u.a. [1], HavıLano 
u.a. [1]). Obwohl die Linearisierung (6.4.2) der Gleichung (6.4.1) nicht die einzige 
und auch nicht immer die effektivste Möglichkeit ist, führen doch physikalische 
Überlegungen dorthin. Vom physikalischen Standpunkt aus bedeutet die Nicht- 
linearität der Gleichung (6.4.1) das Vorhandensein einer Wechselwirkung zwischen 
den Gasmolekülen (wenn man eine Aufgabe der Gasdynamik betrachtet). Bei der 
Modellierung der Molekülbewegung wird zuerst irgendeine Anfangsverteilung ihrer 
Phasenkoordinaten, also 9(®(#) vorgegeben. In dem durch diese Anfangsverteilung 
gebildeten Feld verfolgt man nun die Bewegung einer Gruppe von Molekülen und 
bringt dann Korrekturen an der Anfangsverteilung an, was im wesentlichen der 
Benutzung von Formel (6.4.2) entspricht. Es wäre interessant festzustellen, ob 
auch eine inhaltliche physikalische Deutung der anderen Linearisierungsmethoden 
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möglich ist, z. B. der Newtonschen Methode zur Lösung nichtlinearer Funktional- 
gleichungen. 

Die Lösung nichtlinearer Gleichungen ist in numerischer Hinsicht eine recht 
schwierige Aufgabe. Vor allem ist es notwendig, alle Werte der gesuchten Funktion 
sogar in dem Fall zu ermitteln, in dem das Schlußresultat nur aus einer Zahl, 
einem gewissen Funktional der Lösung @, besteht. Ist die Aufgabe mehrdimen- 
sional, so erfordert das viel zusätzlichen Speicherraum der EDVA. Eine zweite 
Frage, die bei der Lösung nichtlinearer Aufgaben mit der beschriebenen Methode 
entsteht, betrifft die Fehleranalyse, da es hier wesentlich mehr Fehlerquellen gibt, 
nämlich sowohl stochastische als auch deterministische. Eine recht ausführliche 
Fehleranalyse für die Lösung der nichtlinearen Boltzmanngleichung findet man 
in der Arbeit von Hıcks und Smıt# [1]. Insgesamt stehen die Untersuchungen 
zum Problem der Lösung nichtlinearer Aufgaben mit der Monte-Carlo-Methode 
allerdings erst am Anfang. Es bleibt zu bemerken, daß in einigen Arbeiten über 
die Lösung nichtlinearer Aufgaben die klassischen Methoden der numerischen 
Analysis mit der Monte-Carlo-Methode verknüpft werden. So wurde eine Diffe- 
renzenmethode in Verbindung mit der Monte-Carlo-Methode zur Lösung der 
Gleichung des Strahlentransports bei Berücksichtigung der Temperatureffekte von 
FLeck [1] benutzt. In der Arbeit von Anorık und BARANZEW [1] wurden mit der 
Monte-Carlo-Methode Integrale berechnet, die bei der analytischen Lösung von 
Aufgaben der Gasdynamik entstehen. 

In Zusammenhang mit der Lösung nichtlinearer Aufgaben muß auch die Arbeit 
von Tsuvpo und Kıyoxo [1] genannt werden, in der ein physikalisches Modell zur 
Lösung nichtlinearer algebraischer Gleichungssysteme betrachtet wird. Obwohl 
in dieser Arbeit die dem Modell zugrunde liegende Idee weniger ausführlich als die 
im einzelnen streng begründete Methode betrachtet wird, ist es angebracht, diese 
Idee darzustellen, weil sie von prinzipiellem Interesse ist und verhältnismäßig 
weit auseinanderliegende Gebiete der Mathematik verbindet. Es sei ein System 
nichtlinearer Gleichungen der Gestalt 


Flensn)=d, = 1,57% (6.4.3) 


gegeben, wobei die F;(&,, ..., x,) nach jeder Veränderlichen x; differenzierbar sind. 
Wir nehmen an, daß das System eine endliche Anzahl reeller Lösungen besitzt, 
die es zu bestimmen gilt. Die darzustellende Methode gibt nicht die Möglichkeit, 
die Vielfachheit einer Lösung des Systems festzustellen, und wir werden für das 
weitere alle Lösungen als einfach voraussetzen. Wir ordnen dem System (6.4.3) 
die Funktion 


n 
Vapo) = N File. &n) (6.4.4) 


mit von Null verschiedenen reellen Konstanten a; zu. Das nun zu bestrachtende 
Modell steht in Beziehung zu Aufgaben der statistischen Physik (vgl. $ 3 dieses 
Kapitels) und besteht in folgendem: Die x,, ..., x, werden als Ortskoordinaten von 
Teilchen angesehen, die sich im Potentialfeld U bewegen. Während der Bewegung 
sind Zusammenstöße mit anderen analogen Teilchen möglich. Das Stoßmodell 
kann weitgehend willkürlich sein, aber es gibt eine mittlere Weglänge, auf der kein 
Zusammenstoß erfolgt (freie Weglänge). Wenn sich im System ein statistisches 
Gleichgewicht eingestellt hat, dann hat die Verteilungsdichte der Koordinaten der 


15* 
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Teilchen im Phasenraum der Koordinaten und Geschwindigkeiten die Gestalt 
C exp (— E/ß). Dabei sind C und 8 Konstanten, und die Energie E ist die Summe 
von potentieller und kinetischer Energie, also E = U(&,, ..., 2) + T(&1; ..., &,) mit 
&; = de,/dt. Daraus ergibt sich wie früher die Dichte der gemeinsamen Verteilung 
der Ortskoordinaten x, ..., &n ZU 


Pl&1> +++, %n) = EXP (-7)/ fe + de] eXp (- 7)- (6.4.5) 


Aus (6.4.5) folgt, daß p(x,, ..., &,) für solche x; ein Maximum annimmt, die Lösungen 
des Systems (6.4.3) sind. Dabei kann der Anstieg in der Umgebung des Maximums 
durch die Wahl der Konstanten a; beeinflußt werden. Das bedeutet, daß man 
beim Verfolgen der Trajektorien im Verlauf eines hinreichend großen Zeitintervalls 
Angaben über die Lage der Lösungen erhalten kann. 

Ein einfaches Modell, das zu den gewünschten Ergebnissen führt, ist das folgende. 
Die Bewegungsgleichungen des Teilchens 


dp: ou 78 

en CRRTE N ia 
ar i= 1... Er 
dt =PDi, —-L,euR;, 


werden durch die entsprechenden Differenzengleichungen ersetzt. Dann wird ein 
beschränktes Gebiet im Raum der Koordinaten gewählt, beispielsweise ein n- 
dimensionaler Würfel mit hinreichend großen Seiten, der bequem in Teilgebiete 
zerlegbar ist. Die Anfangslage der Teilchen des Systems wird als gleichverteilt 
im gewählten Würfel angenommen. Weiter wird eine Größe T'max gewählt, die den 
maximal möglichen Wert der kinetischen Energie angibt. Alle Bewegungsrichtun- 
gen im Anfangsmoment seien gleichwahrscheinlich, und die Anfangsenergie be- 
trage T=& Tmax; wobei x wie immer eine auf [0, 1] gleichverteilte Zufallsgröße 
bezeichnet. Die Geschwindigkeit im Anfangsmoment ergibt sich dann zu &, = pı 
= YTo, wobei die v; Komponenten eines in allen räumlichen Richtungen gleich- 
verteilten Einheitsvektors sind. Die zeitliche Schrittweite hängt mit der freien 
Weglänge A und der Wahrscheinlichkeit s eines Stoßes zusammen. Für At wählt 
man At = sA//T (Weg durch Geschwindigkeit). Entsprechend den Gleichungen 
(6.4.6) werden die neuen Lagen der Teilchen und die neuen Geschwindigkeitskom- 
ponenten berechnet, wobei die Summe der Quadrate der Geschwindigkeitskompo- 
nenten die neue kinetische Energie des Systems liefert. Dann wird wieder die 
zeitliche Schrittweite bestimmt usw. Bei jedem Schritt wird geprüft, ob ein Zu- 
sammenstoß stattgefunden hat. Die Wahrscheinlichkeit eines Stoßes beträgt s < 1 
für T< Tmax und ist gleich Eins, wenn 7 nicht kleiner als Tax ist. Nach dem 
Zusammenstoß wird die Energie zu &,Tmax gewählt, die Bewegungsrichtung ist 
gleichverteilt wie zu Beginn der Teilchenbewegung. Daher übersteigt die kinetische 
Energie nicht 7 „ax, was zur Einstellung einer stationären Verteilung beiträgt. 
Wenn. die Teilchen das vorgegebene Teilgebiet verlassen, dann besteht Grund 
zur Annahme, daß sich dort keine Lösungen des Systems befinden. Solche Teil- 
gebiete schließen wir aus der Betrachtung aus. Nun sei ein Teilgebiet festgestellt 
worden, in dem eine Konzentration der Teilchen stattfindet. Mit Hilfe der statio- 
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nären Verteilung wird dann 


ia Sda,- S da. x; exp (— U/B) 
k S da, --- [ de, exp (— U/ß) 


berechnet, das Mittel über die Trajektorien (d. h. das Mittel der Werte in den Ecken 
des Polygonzuges) in. den Grenzen dieses Teilgebietes. Dieser Mittelwert approxi- 
miert bei entsprechender Wahl der Konstanten «a; die i-te Komponente der Lösung, 
wenn es innerhalb des Teilgebietes eine Lösung gibt, oder die Summe der ?-ten 
Komponenten der Lösungen, wenn es dort mehrere Lösungen gibt. Dabei streben 
für 7 — oo alle Dx, gegen Null, wenn es nur eine Lösung gibt. Sind es mehrere, 
dann strebt wenigstens ein Dx,; gegen eine von Null verschiedene Konstante. In. 
diesem Fall muß man das Gebiet bezüglich der Veränderlichen teilen, für die Dx; 
maximal ist. Durch solche Unterteilungen kann man offensichtlich die Lösungen 
lokalisieren. Dabei sollte man beachten, daß die Werte von x; in den Ecken des 
Polygonzuges abhängige Zufallsgrößen sind (Aufgabenstellung C in Kap. I). Die 
Verkleinerung von T'yax, A und die Vergrößerung der a, gibt uns die Möglichkeit, 
die Lösungen mit größerer Genauigkeit zu bestimmen. 


Damit soll die Darstellung der grundlegenden Ideen in der von Tsupo und 
Kıyoxo [1] vorgeschlagenen Lösungsmethode für nichtlineare Gleichungssysteme 
abgeschlossen werden. Freilich wären noch weitere Untersuchungen nötig, um 
konkrete Vorschläge für eine günstige Wahl der Parameter Tax, A und a; machen 
zu können. Es bleibt auch eine offene Frage, von welchem Moment an die Ver- 
teilung als stationär anzusehen ist oder wie man die Dispersionen der Größen x; 
während der Rechnung effektiv schätzen kann. In der genannten Arbeit wird ein 
numerisches Beispiel angegeben. Es wird das System 


3 
y-n=0: 


5 
“+P- Tel 


gelöst. Zunächst wurde Tmax=4 s= 0,1; 4=0,1; u —=1 gewählt. Nach 
2000 Schritten wurde eine Trennung der Lösungen erreicht und Tax um den 
Faktor 410 verkleinert, } = 0,01 und a; = 10 gewählt. Durch weitere fünftausend 
Schritte wurden die Lösungen mit einem Fehler von etwa 5% bestimmt. 

Die beschriebene Methode kann man offensichtlich auch bei der Extremwertbe- 
stimmung anwenden. Dabei kann man alle Extremwerte finden. Obwohl die 
Anwendung von Differentialgleichungen zur Lösung von Gleichungssystemen oder 
zur Extremwertbestimmung auch ohne Monte-Carlo-Methode möglich ist, schließt 
ein nichtstochastisches Verfahren die Schätzung der Dispersion und folglich eine 
Verteilung der Lösungen und Extremwerte aus. Dieser Umstand besitzt prin- 
zipielle Bedeutung und sollte daher besonders betont werden. 


3. Extremwertbestimmung einer Funktion. Die Aufgabe der Extremwertbe- 
stimmung wurde schon in Zusammenhang mit den Methoden der stochastischen 
Approximation und in Abschnitt 2 behandelt. Es gibt viele Arbeiten, in denen 
randomisierte Verfahren der Extremwertsuche betrachtet werden. Es genügt aber, 
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hier die diesen Fragen gewidmete Monographie von RASSTRIGIN [1] und die schon 
frü her zitierte Arbeit von WAISBORD und JuDın [1] zu nennen. Diese selbständige 
und vielversprechende Entwicklungsrichtung wird von uns nur teilweise im Zu- 
sam menhang mit anderen Aufgaben berührt. Hier werden wir nur zwei Bemer- 
kungen zu Methoden der Extremwertsuche unter sehr allgemeinen Voraussetzungen 
bezüglich der Funktion f(x) machen (Differenzierbarkeit der Funktion wird nicht 
vorausgesetzt). 


Das einfachste Verfahren, das man sich denken kann, wenn die Funktion nicht 
als differenzierbar vorausgesetzt wird, besteht in folgendem (ZIELISSKT [1]): 
Gegeben sei eine Funktion f(x) in einem beschränkten Gebiet D des euklidischen 


Raumes. Wir bilden eine Folge &,,&,,.... von Realisierungen eines in D gleich- 
verteilten Zufallsvektors und setzen dann 
%; fü x &-1> 2 
3 =fa), = f° = ie) > a-ı (6.4.7) 
8:1 für far) Ss. 


/(&) wird als eine im Lebesgueschen Sinn meßbare Funktion vorausgesetzt. Ist 
$; = sup /(#) (der Fall des Infimums wird analog betrachtet) und mes {x : f{@)=s,} 
= (, dann ist die Wahrscheinlichkeit dafür, daß ein x; mit dem Extrempunkt x, 
zusammenfällt, gleich Null. Daher gibt uns das Verfahren (6.4.7) eigentlich keine 
Möglichkeit den Extrempunkt zu finden. Die Aufgabe bekommt einen Sinn, wenn 
ein Punkt aus der Menge E* = {x : f(x) > s”} bestimmt werden soll, wobei E* 
ein positives Maß hat. In diesem Fall kann das Verfahren (6.4.7) zu einem Erfolg 
führen. Zu den Aufgaben solcher Art gehört beispielsweise die Aufgabe über den 
optimalen Auslastungsplan einer Einrichtung (Kap. III, $3). Leicht lassen sich 
weitere Beispiele für Aufgaben angeber, in denen ein hinreichend großer (oder 
kleiner) Wert von f(&) gefunden werden soll, aber nicht unbedingt der Punkt, in 
dem f(x) seinen größten (oder kleinsten) Wert erreicht. Ist jedoch f(x) stetig, 
dann folgt bei hinreichend kleinem e aus der Ungleichung mes {x:f(@) > s*} ss 
daß die Punkte der Menge E* genügend nahe beim Supremumpunkt von f(&) 
liegen. Wir bezeichnen mit Alm = n; N) die Ereignisse, die darin bestehen, daß 
unter N Versuchen n Funktionswerte /(&;) größer als der Wert s* sind. Mit a* 
bezeichnen wir das Maß von E*. Dann gilt 


P(Alm >0;N)|u*=e)=1—P(Am=0;N)|u*=e) =1-—(l-e)!. 
Wollen wir beispielsweise die Werte x aus der Menge E* mit «* <e mit einer 
Wahrscheinlichkeit, die nicht kleiner als 1 — & ist, erhalten, dann können wir die 


dafür notwendige Zahl N angeben, die der Ungleichung (1 — e)" < e genügt. Dar- 
aus ergibt sich 


: log & 
Nıl 1—-e.)*w]1l R Ne —_, 
0g ( 5) og € N re 


In Tabelle 6.3 sind einige Werte für N in Abhängigkeit von e angeführt. 


0,2 | 0,1 | 0,05 | 0.02 | 0,01 | 0,005 | 0,002 I 0,001 


F | 05 | 


N | ıls|» | 58 'ıoa | 458 | 1057 | 3104 | 6903 
Tabelle 6.3 
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Ein anderer Weg, der im Zusammenhang mit der Modellierung von Verteilungen 
steht, kann in gewissen Sonderfällen nützlich sein. Wir nehmen an, daß |/(&)| für 
alle x aus D beschränkt ist. Man kann stets erreichen, daß O< fix) <M gilt 
und der Inhalt (das Maß) von Dgleich Einsist. Wenn c,f{a) normiert ist und daher 
als Verteilungsdichte einer Zufallsgröße angesehen werden kann, dann werden sich 
die Stichprobenwerte für & um den Punkt gruppieren, in dem f(&) seinen. größten 
Wert hat. Ist auch noch die Dichte c„f*(®) mit n > 1 einfach genug zu modellieren, 
so kann man hoffen, den größten Wert von f(&) mit geringem Rechenaufwand zu 
finden. Man zeigt leicht, daß die v.-Neumannsche Methode in diesem Fallzu einem 
Verfahren führt, das dem eben beschriebenen (vgl. (6.4.7)) sehr ähnlich ist. Wenn 
jedoch für einige Veränderliche die Anwendung der Umkehrformeln oder anderer 
Methoden möglich ist, dann kann das der Ausgangspunkt für eine Verbesserung 
des Algorithmus (6.4.7) sein, 


VII, MIT DER ZAHLENTHEORIE ZUSAMMENHÄNGENDE FRAGEN 


$1. Gleichverteilte und vollständig gleichverteilte Folgen 
Der. Begriff der arithmetischen Modellierung von Zufallsprozessen 


Die stochastischen Methoden, die in den ersten sechs Kapiteln untersucht wurden, 
ermöglichen die Zurückführung von Aufgaben, die mit der Monte-Carlo-Methode 
lösbar sind, auf die Berechnung eines Integrals hoher Vielfachheit über einem 
Einheitswürfel. Das ergibt sich aus der von uns durchgeführten Konstruktion 
des Maßes, über das integriert wird. Der Integrand braucht dabei keine Glattheits- 
eigenschaften zu besitzen und besitzt diese in der Regel auch nicht. Freilich zielen. 
die Methoden der Dispersionsverkleinerung darauf hin, den Integrand möglichst 
zu einer Konstanten werden zu lassen. Wenn es gelingt, die Dispersion hinreichend 
klein zu machen, dann kann die Qualität der Zufallszahlen das Resultat nur wenig 
beeinflussen. Gerade im allgemeinen Fall erweist sich die Herleitung einer Pseudo- 
zufallsfolge als eng benachbart zum Problem der näherungsweisen Integration bei 
deterministischer Aufgabenstellung. Offensichtlich muß dabei die Funktionen- 
klasse, für die die entsprechende Quadraturformel hergeleitet wird, hinreichend 
umfangreich sein. Prinzipiell ist es möglich, eine solche Punktfolge in einem 
Würfel beliebiger Dimension zu konstruieren, daß das arithmetische Mittel der 
Werte einer willkürlichen im Riemannschen Sinn integrierbaren Funktion in 
diesen Punkten bei Vergrößerung der Summandenzahl gegen den Wert des ent- 
sprechenden Integrals konvergiert. Dabei wird die Konvergenz im deterministi- 
schen Sinn verstanden. Dieses Resultat besitzt prinzipielle Bedeutung, und wir 
gehen anschließend näher darauf ein. 


Wir betrachten nun eine unendliche Folge von Zahlen mit unendlich vielen 
Ziffern, In der Regel werden wir annehmen, daß die Zahlen als Dualzahlen aus 
dem Intervall [0, 1) gegeben sind. Die Beschränkung auf ein Zahlensystem ist 
nicht wesentlich, vereinfacht aber manchmal die Darstellung. 

Es seien &,,» = 1, 2, ..., Dualzahlen mit nichtbeschränkter Stellenzahl aus [0, 1) 
und & = &,, &, .... eine unendliche Folge dieser Zahlen. & heißt gleichverteilt im 
Weylschen Sinn auf [0, 1), wenn für eine beliebige im Riemannschen Sinn eigentlich 
integrierbare Funktion A gilt: 

1 


N 
lim z 5 hlen) - [ne dx. 9.2:L0) 
N+oN gel 

ö 


Weiterhin führen wir die Bezeichnung 


P(S,) = lim 4 DE 
No N 5 erfüllt 
1<nzN 
ein, wobei S, eine Aussage in Abhängigkeit von einer natürlichen Zahl ist. 
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Aus (7.1.1) folgt, daß der Anteil der Glieder der Folge &, die in das Intervall 
[e, 5), 0 <a <b< 1, fallen, für jedes « und b asymptotisch gleich der Länge b — « 
dieses Intervalls ist, also 

Pasa.<b)=b-a. (7.1.2) 
Man kann auch zeigen, daß aus (7.1.2) wieder (7.1.1) folgt, so daß man (7.1.2) 
ebenso als Definitionsgleichung der Gleichverteilung nach WEYL benutzen kann. 

Für die Konstruktion ist es bequemer, die Folge & als Funktion eines ganz- 
zahligen Arguments aufzufassen, also &, = /(n), OS f{n)< 1. Wenn dabei die 
Folge & gleichverteilt ist, so sagt man, daß auch f(r) gleichverteilt ist. Für f(n) 
wählt man häufig den gebrochenen Teil einer Funktion mit ganzzahligem Argu- 
ment, also f(r) = {g(r)}. Die Funktion g(n) kann beliebige reelle Werte annehmen. 
Ist f(n) gleichverteilt und gilt /(n) = {g(n)}, so sagt man auch, daß g(n) gleich- 
verteilt ist nach dem Modul 1 (mod 1). Eine wichtige Bedeutung für das weitere 
hat das Weylsche Kriterium, das den Inhalt des anschließenden Satzes bildet. 


Satz 7.1 (Wayr [1]). Die Folge e ist genau dann gleichverteilt, wenn 


N 
lim 3 & exp (2 rike,) = 0 
N>oN 1-1 


für jede von Null verschiedene ganze Zahl k gilt. 


Beweis. Der Beweis der Notwendigkeit ist klar. Wir zeigen, daß der Satz 
auch hinreichend ist. Dazu gehen wir von (7.1.2) aus und nehmen ohne Beschrän- 
kung der Allgemeinheit an, daß e, der gebrochene Teil einer mod 1 gleichverteilten 
Funktion g(r) ist. 

Nun sei @(t) eine Funktion mit der Periode 1, die auf dem Intervall [0, 1) in 
folgender Weise definiert ist: 


ie = 
an für 0<t<y, 

0 für ysiı<l. 
Dann gilt offenbar 

12 „1: 

P(O < {g(n)} <y) = lim NV BR) z (7.1.3) 
N>X n= 
Wir wählen nun ein 8 >0 so, daß gleichzeitig die Ungleichungen 28 <y und 


28 <1-—y erfüllt sind. Dann werden zwei stetige Funktionen @, und @, mit 
der Periode 1 folgendermaßen gebildet: 


1 für 0sisy, 

Gl) = linear für ysisy+ß, 
0 für y+HBSt<1-B, 
linear für 1—-B=sisl, 
linear für 0<SI:sSß, 

G;(t) = 1 für pstisy-Pß: 

= |; eü = 

inear ür y—-Pstsy, 
0 für yst<sl. 
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Offensichtlich gilt 
VNZSECH<AM. (7.1.4) 


Sowohl @,(t) als auch G,(£) werden durch eine gleichmäßig konvergente Fourier- 
reihe dargestellt: 


aU)=y+Pß +, E (a; exp (Arrikt) + br exp (— 2rikt)) , (7.1.5) 
Gt)=y—ß+ F (a; exp (2rikt) + b, exp (— 2rikt)) . (7.1.6) 
RZı 


Um den Beweis abzuschließen, muß man £ = g(n) setzen und die Reihen (7.1.5) 
und (7.1.6) fürn =1,2,..., N addieren. Für #5 —0 folgt aus (7.1.3) und (7.1.4) 
das Geforderte. 
Übrigens folgt aus dem Weylschen Kriterium sofort die Äquivalenz der Defini- 
tionen der Gleichverteilung nach (7.1.1) und (7.1.2). 


Zur Herleitung eines Beispiels einer im Weylschen Sinn gleichverteilten Folge 
benötigt man das folgende einfache Lemma. 


Lemma 7.1. Es gilt die en 


m-+p 
3 exp( er) < < wind 


n=m-+1 


2 

7.1.7 

mem) Be 

Für ganzzahlige 8 ist Mr richtig. Ist R keine ganze Zahl, so kann man die 
Summenformel für die endliche geometrische Reihe anwenden, also 


me exp (2miß(m + 1)) (1 — exp (2mißp)) 
n 2, “ LER) 1- exp (Zip) = 


Der Betrag des Zählers in diesem Ausdruck ist nicht größer als 2 und der Betrag 
des Nenners nicht kleiner als |sin (#)|, womit das Lemma bewiesen ist. 


a: Für jede ganze Zahl k #0 und beliebige irrationale Zahl B gilt 


5 exp (2rtiknß)| < dm, — in (N, : zu)” 


A 11 wg " Isin (sekB)| 


Jim 7 


Daraus ergibt sich, daß die Folge 
&n = {nß} (7.1.8) 


mit einer Irrationalzahl 8 im Weylschen Sinn gleichverteilt ist. Damit ist auch die 
Existenz gleichverteilter Folgen bewiesen. 


Der Begriff der Gleichverteilung nach Weyr läßt sich auf Folgen von Vektoren 
erweitern. Man sagt, daß die Folge = #,,%,,... mit &. = (ce, ...,e®) im 
s-dimensionalen Einheitswürfel gleichverteilt ist, wenn für jede im Riemannschen 
Sinn eigentlich ee Funktion h(&) 


1 
lim N-1 5 hiz,) = Far. Sam hix) (7.1.9) 


Noo n=1 
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gilt. Äquivalent dazu ist die Forderung 
8 
P(a; s ei) R b;, i= 4, ...; s) = II (b; _ d;) 
i-1 


für beliebige a; und 5, mt O< ;<b,< 1. Genau wie im eindimensionalen Fall 
betrachtet man oft Folgen von Vektoren, deren Komponenten Funktionen eines 
ganzzahligen Arguments sind, also &, = (fı(n), »., An), 0<fin)<1. Es gibt 
auch ein mehrdimensionales Analogon zum Weylschen Kriterium. 


Satz 7.2. Genau dann ist die Folge Q im s-dimensionalen Einheitswürfel gleich - 
verteilt, wenn die Beziehung 
ı 
lim — & exp (2riükjeld +. + k,e)) = 0 
Now4 n=l 
für alle ky, ..., k, gilt, die nicht gleichzeitig Null sind. 
Der Beweis des Satzes 7.2 entspricht völlig dem Beweis von Satz 7.1. 


Die Komponenten der Vektoren der Folge @ können aus Elementen der Zahlen- 
folge & auf verschiedene Art gebildet werden. Beispielsweise kann man 


= (& --» 8) > 


2 = (&+1; ...; &25) ’ 


er ale (7.1.10) 
En = (E(in—1)s +15 s Ens) B 
oder 
2 = (& -,8); 
2, = (Eu 1, &1) > 
Ba (7.1.11) 


setzen. Die Folge (7.1.11) nennen wir eine Kette der Folge & vom Rang s. Mit 
diesem Verfahren (7.1.11) zur Bildung einer Vektorfolge ist folgende Definition 
verbunden: 


Definition. Die Folge & heißt s-gleichverteilt, wenn die durch eine Kette der 
Folge & vom Rang s gebildete Vektorfolge im s-dimensionalen Einheitswürfel 
gleichverteilt ist. 


Wir notieren einige Eigenschaften einer s-gleichverteilten Folge. 

1. Ist die Folge & s-gleichverteilt, so ist sie auch p-gleichverteilt für alle p < s. 
Die Aussage folgt unmittelbar aus dem mehrdimensionalen Weylschen Kriterium 
(Satz 7.2). 

2. Die umgekehrte Aussage ist im allgemeinen falsch. Wir zeigen dazu, daß die 
Folge (7.1.8), ß, 2ß, ..., nß, ..., mit einer Irrationalzahl £ nicht 2-gleichverteilt und 
folglich auch nicht p-gleichverteilt ist (p > 2). Für eine 2-gleichverteilte Folge 


236 VII. Mit der Zahlentheorie zusammenhängende Fragen 


muß notwendigerweise die Beziehung 


1 
Plen+ı < h(en)) = h(x) dx 


für jede integrierbare Funktion A, 0 <h<{1, erfüllt sein. Speziell für h(x) = x 
gilt 


1 
Pin < nr) =1—-Plnzı <E) = 3 


Für die Folge (7.1.8) ist aber die Ungleichung &, > &u+ı gleichbedeutend mit 
En > {&n + ß}. Diese ist genau dann erfüllt, wenn 1-3 <&,<1 gilt. Daraus 
ergibt sich 


Pn>an)=PLl-B<a<h)=Pß +5. 


In diesem Fall war die Funktion g(r), deren gebrochener Teil die Folge & bildet, 
eine lineare Funktion. WzyL [1] betrachtete auch kompliziertere Funktionen, 
insbesondere Polynome in n: 


En = {BnP + omPt tun 40}. (7.1.12) 


Dabei sind c,, ..., c» beliebige Zahlen und £ eine Irrationalzahl. Für diese Folgen 
gilt folgende Aussage, deren Beweis man in einer Arbeit von FRANKLIKN [1] findet. 


Satz 7.3. Istder Hauptkoeffizient ß des Polynoms g(n) = Pn® + on? +. 460 
eine Irrationalzahl, so ist die Folge (7.1.12) p-gleichverteilt, aber nicht (p + 1)- 
gleichverteilt. 


Durch Wahl eines Polynoms g(x) von hinreichend hohem Grad kann man also 
eine entsprechende hohe Ordnung der Gleichverteilung der Folge & sichern. 

Der Grenzfall einer s-gleichverteilten Folge für beliebiges s wurde von N.M. 
Korogow [1] betrachtet. 


Definition. Die Folge & heißt vollständig gleichverteilt oder im Korobowschen 
Sinn gleichverteilt, wenn sie für jedes natürliche s s-gleichverteilt ist. 


Nach Satz 7.3 kann man erwarten, daß die Folge der gebrochenen Teile einer 
schneller als jede Potenz wachsenden Funktion eine vollständig gleichverteilte 
Folge bildet. Als erster konstruierte N. M. KoRoBow eine vollständig gleichverteilte 
Folge im Zusammenhang mit der Untersuchung der Verteilung der gebrochenen 
Teile einer Exponentialfunktion. Die Existenz vollständig gleichverteilter Folgen 
ist eine Aussage von prinzipieller Bedeutung, obwohl ihre algorithmische Erzeugung 
recht kompliziert ist. 


Anschließend gehen wir kurz auf die Konstruktion dieser Folgen ein. Dabei schließt 
sich die Darstellung mit geringen Änderungen der Arbeit von Posrxıkow [1] ant). 

Es sei & = 6, Ö3 «.., Om; -. eine Folge natürlicher Zahlen mit 0O<d,;<q—1 für 
alle ©. Wir bilden nun eine Kette vom Rang s 


(ö1; Ög, .... ö,) ’ (Ös Ög, u... Ös+1); “... (öx: ÖN-+1; ... ÖN+s-ı) ’ (7.1.13) 
1) Eine wesentlich einfachere Methode zur Konstruktion vollständig gleichverteilter 


Folgen, die aber nicht mit einer stochastischen Deutung verbunden ist, findet man in 
der Arbeit von KoRoBow [2]. ; 
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deren Elemente wir Klammern nennen. Wir betrachten eine beliebige Klammer 
49 = (61, 68, ..., 69), die ihrerseits eine feste Menge von Zahlen zwischen 0 undg — 1 
darstellt, und bezeichnen mit Py(4°) die Anzahl des Auftretens der Klammer 4° bis 
zum N-ten Element der Folge. 
Die Folge e heißt eine normale Folge, wenn für jedes natürliche s und jedes feste 40 
die Beziehung 
lim N! P (4%) = q® 


No 


erfüllt ist. Dann gilt folgender 


Sat z 7.4 (SCHAPIRO-PJATEzZKI [1]). Wenn eine Konstante C derart existiert, daß für 
beliebige natürliche s und jede feste Klammer 4° 


lim N Py(4%) < Cq=® 
N>o 
gilt, dann ist die Folge e normal. 
Der Beweis des Satzes stützt sich auf folgendes Lemma. 


"Lemma 7.2. Es sei r eine natürliche Zahl und |t| >1. Die Anzahl von Kombina- 
tionen aus I Elementen, in denen jedes feste Element ö(V in der Anzahl I/g + tl/r vor- 
kommt, übersteigt nicht q’r!/(412). 


Beweis. Die Anzahl von Kombinationen aus Z Elementen, in denen ö(0) genau 
Il 
k mal vorkommt, beträgt bekanntlich | k ) (q — 1)!-k. Daraus ergibt sich die Anzahl 
der durch die Bedingungen des Lemmas bestimmten Kombinationen zu 
k I—k 
y= 2 („Je-w=e P3} (.)5) (1-2) . (7.1.14) 
k-4H24 k 424 k/\a q 
7 f: q r 
Das Weitere folgt aus bekannten Identitäten für die Binomialkoeffizienten (z. B. 
NATANSoX [1]): 


3 (; Ja -a)l-k=1, (7.1.15) 
k-o\k 

> (k — 1a) h Ja — a)-k= all — a). (7.1.16) 
3=0 k 


Die erste Identität ist eine unmittelbare Folgerung der binomischen Formel. Die 
zweite ergibt sich folgendermaßen aus der ersten. Man differenziert die Gleichung 


2 
Pi ( : )e = (1 + z)! nachz und multipliziert dann beide Seiten mit z. Von neuem wird 
k=0 
nach 2 differenziert und wieder mit z multipliziert. Setzt man z = x/(l — x), so erhält 
nacheinander 


al.) — o)-k=1, (7.1.17) 
5 („yet ee, (7.1.18) 
k=0 


> ka („Ju a) = (le +1 —a)ie. (7.1.19) 
k=0 
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Nun multiplizieren wir (7.1.17), (7.1.18) und (7.1.19) jeweils mit Z?x?, —2l® und 1, 
addieren alles und erhalten (7.1.16). 

Wir kommen nun zur Abschätzung der Größe y. Die Summation in (7.1.14) erstreckt 
sich über diejenigen %, die der Ungleichung 


F- > 7 >- oder (# = =) (7) >ı 
q 1] 


M jet 
se) 


Erstreckt man ii RR auf der rechten Seite der letzten Ungleichung über 


allek, O<%k=sI, so bleibt die Ungleichung richtig. Setzt man in (7.1.16) 2 = = ‚so 
ergibt sich das gewünschte Ergebnis, und das Lemma ist bewiesen. q 


Beweis des Satzes. Wir zerlegen die Folge in Gruppen von je Z Elementen 
also Öj, +.., Öt5 Öt+1: ++» Ö245 ..., und wählen eme feste Zahlr. Eine Gruppe soll zur 
Kategorie A gehören, wenn 6ö() in der Anzahl !/g + r//r, || = 1, in dieser Gruppe 
vorkommt; andernfalls gehört die Gruppe zur KategorieB. Mit A(N) bzw. B(N) 
bezeichnen wir die Anzahl der Gruppen in der Kategorie A bzw. B bei einer Folge 
der Länge ![N/l]. Dann kommt (9) bis zum N-ten Element der Folge in folgender 
Anzahl vor: 


Py(ö0) = A(N) (- & =) + 9B(N)I + Hl 


-_ (5 = BIN) + 0) (- +) + HB + 0 
q r 
Tr 
re, + Bo) [94 Sa -#]+ RE RT 
q r: q r q r 


mit 0 < 9, % = 1 und |d] <1. Nach den Voraussetzungen des Satzes kommen für 
hinreichend große N Gruppen der Kategorie B nicht öfter als 20 N/q!-mal vor. Nach 
dem Lemma ist die Anzahl der verschiedenen Gruppen der Kategorie B von der Ord- 


4 
nung o(« =) . Daher gilt 


Damit ergibt sich für Py(6(%) 
PER 4 
im 1 P,(0) — 7. ER, (7) +0 (7) 
No |N q r 


2 I 


Da r und } beliebig sind, erhalten wir lim Py(69)/N = 1/q für N— oo. Wenn man 
nun eine Klammer aus s Elementen als ein Element betrachtet (dann gibt es g° Ele- 
mente), so ist auch leieht lim Py(A)/N = 1/g® für N — zu zeigen. 
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Wir betrachten nun ein von CHAMPERNOWNE [1] angegebenes Beispiel für eine nor- 
male Folge mit qg = 2 Elementen. (Eine analoge Herleitung ist auch für beliebiges q 
möglich.) 

Es sei 0, 1, ...., 2" — 1 eine Menge von Zahlen, die r Stellen in der Dualzahlendar- 
stellung haben. Wir schreiben diese Zahlen nun in der natürlichen Reihenfolge hin, also 


fürr=1: , =0,1; 
fürr=2: 9 = 00, 01,10, 11; usw. 
Daraus wird die Folge 
0102 "Or" (7.1.20) 


gebildet, in der die Kommas als Trennzeichen beibehalten werden. Wir zeigen nun, 
daß die Folge (7.1.20) normal ist. Dazu wird aus dieser Folge eine Kette vom Rang s 
gebildet und eine feste Klammer 4, gewählt. Wir setzen noch 


Sr = 0109 *'' Or (7.1.21) 


Ist A, so in e, enthalten, daß kein Komma 4, teilt, dann heißt 4, ungeteili. Andern- 
falls heißt 4A, geteili. Für s < r gibt es keine ungeteilten Klammern. Für s > r gibt 
ess— r + 1 Möglichkeiten, wie 4, in o, enthalten sein kann, weil das erste Element 
von 4, das erste Element einer r-stelligen Dualzahl oder auch das zweite Element 
usw. sein kann. Bei fester Lage von d, können die übrigen s — r Elemente beliebig 
sein. Daraus folgt für die Anzahl der ungeteilten Klammern 4, in $, der Ausdruck 
(r —s + 1) 2°=r. Wird aber ein festes Komma betrachtet, dann kann es nieht mehr 
als s verschiedene 4, teilen. Daraus ergibt sich, daß ö, in o, nicht öfter alsr - 2”-mal 
geteilt vorkommen kann. 

Wenn man mit Ah, diejenige Anzahl bezeichnet, die angibt, wie oft 4, in o, vor- 
kommt, so ergibt sich für r > 


,=(r—s+1)27-° +4 0(r). 
Die Anzahl der Dualelemente in o, beträgt r - 2" = y,, so daß 
hr = yr2? + O(yr) 
gilt. Für die Anzahl X, des Auftretens von 4, in S, ergibt sich 


H,= Eh + Ok). 


r 
Mit x2,= Yy, erhält man H, = 2,273 + O(z,) oder für H,= H(a,) als Funktion 
vona, '-1 
H(&r) 2-5 4 O(z,) . 
%r % 
Mit , <x< %+1 gilt 
Hi«) _ H(&r+1) _ Hlar+1) +1 
< <- 


%r %r +1Tr 


Wegen 
ENT SAFE DEN 
% % r2r 
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findet man schließlich 
mA) 5.2-. 
% 


Nach Satz 7.4 ist die Folge von CHAMPERNOWNSE [1] eine normale Folge von Elementen. 
Ferner sei ein System von Folgen 


ER RR 
&, Sue Özıdan ’ 
&, = Öl - - - 


gegeben, wobei die Folge &,; aus den Elementen 0,1, ..., g-ı besteht, j=1,..,k; 
>= 2. Für dieses System kann man eine Matrizenkette vom Rang s konstruieren: 


ER 0 IERER SEN, 
er Fran: VRESRESEEEESEER, PRAERE, (7.1.22) 
Öp,1. ++ Öhs ÖR,2 ++ - Ök,s-+1 


Offensichtlich gibt es (9,93 *-- 9x)” verschiedene Matrizen, aus denen die Folge (7.1.22) 
bestehen kann. ä 

Das System von Folgen (7.1.22) heißt gemeinsam normal, wenn die Anzahl Hp(4,) 
des Auftretens einer beliebigen festen Matrix 4, in einer Folge (7.1.22) der Länge P 
für P — wo gegen (192 ** 94) ° strebt. 


Offenbar kann die Theorie der gemeinsam normalen Folgen auf die Theorie der 
normalen Folgen zurückgeführt werden, wenn man als Elemente der Folge die Spalten- 
vektoren 


öl; 
=; ie l,2-.: 
Öki 


nimmt und die Kette vom Rang s nach der oben genannten Regel bildet. Weil es 
G142 '"" Q& verschiedene Spalten gibt, ist in diesem Fall qg = 9193" 9, und man kann 
einen dem Satz 7.4 entsprechenden Satz formulieren. 


Satz 7.4’. Wenn für das System von Folgen (7.1.22) eine Konstante Ü derart ewistiert, 
daß für jedes natürliche s und jede feste Matrix 4, 
lim H p(4,) 
P>o pP 


< Olg192 94) 


gilt, dann ist das System von Folgen gemeinsam normal. 


Wir nehmen nun an, daß es gelungen ist, ein unendliches System von Folgen 
&,, © ... so zu konstruieren, daß bei beliebigem festen natürlichem ZI das System 
&,, &,, ..., &; gemeinsam normal ist. Die Elemente ö,; jeder Folge &; sollen die Werte 
0, ..„g — lL annehmen. Wir setzen nun 


65 , © 6 
er ae 
q i=1 9 


Dann gilt 

Satz 7.5. Die Zahlenfolge &, &a, ... ist vollständig gleichverteilt. 

Beweis. Wir setzen 2, = (a, & +1, „+. &tts-ı), k = 1, 2, ..., mit einer festen na- 
türlichen Zahls. Neben x; betrachten wir den Punkt a) = (a), Her a) _,) mit 
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den durch die Teilsumme of -2 ö,,/g‘ dargestellten Koordinaten. Da wir das System 


&,, &y, ..., &; als gemeinsam Borna. ARRERENENEN: haben, kommt jeder Punkt = mit der 
asymptotischen Häufigkeit q”"* vor. Das bedeutet, daß bei Teilung des s-dimensionalen 
Einheitswürfels in N gleiche Würfelchen (jede Kante wird in g’ gleiche Teile zerlegt) die 
Punkte der Folge a, I, «M, .„.. eine solehe asymptotische Häufigkeit besitzen, in eines 
der Würfelehen zu fallen, die gleich seinem Volumen ist. Da ! und s beliebig waren, 
ist der Satz damit bewiesen. 

Ein System von ! gemeinsam normalen Folgen kann für jedes feste l leicht angegeben 
werden. Dazu kann man beispielsweise die Folge von CHAMPERNOWNE für q = 2%! 
konstruieren und jedem Element einen Spaltvektor aus ! Nullen und Einsen zuordnen. 
Ein unendliches System ist nicht so leicht angebbar. Dafür wäre es günstig, ein In- 
duktionsverfahren zu finden, so daß man durch ‚Hinzufügen‘ einer geeigneten Folge 
zu einem normalen System wieder ein gemeinsam normales System erhält. An- 
schließend werden wir ein solches sukzessives Verfahren beschreiben (STARTSCHENKO 
[U 12). 

Es sei ö,ö,... die ursprüngliche Folge und 4, eine beliebige feste Klammer einer 
Kette vom Rang s von dieser Folge. Mit H,(4,) bezeichnen wir die Anzahl der Klam- 
mern 4, auf einem Abschnitt aus den r Klammern, die die Kette bilden. Wegen der 
Normalität der ursprünglichen Folge gibt es ein R= R(s, ö,), so daß für »’ > R und 
r"’ > R 

Brid) _ — #5 (7.1.23) 
r 


y' 
gilt. Wegen 
Hy(4s) _ Hır(4,) Hyr(A,) 5: H,r(A,) 
H,(4,) = H,"(4,) = r g“ Eu = r (7.1.24) 
r’ — r” r 2’ 
1-— 1-— 
r r 


folgt für »”” > R(A,) mit geeignetem R(A,) aus der Normalität der Ausgangsfolge die 

Ungleichung 
nn < Cd. 

Wir en, nun N(s) = sup (R(4,), R(s, 4,)). Dann ergibt sich bei beliebigem s für 

r” > N(s) und r’ — r” > r’ aus (7.1.23) und (7.1.24) die Beziehung 


OR | 
Hy(4A,) — Hır(A,) vg-s "or 
BEE 0. Zr. (ERBE ur Be SR ee. ET = H,(A Me 
y! —_g” < y’ gr r ( s) i PZ 
7 
Eu al un r” r) u Hrr(As) 
r' — r”’ 
<erlitZ Fr +) < 09. 


Ferner setzen wir 
N(2) = N(2) und N(28) = MmN(2s — 2) + 2° — 1, 
wobei n, eine beliebige natürliche Zahl mit 
N(2s) < Zu N(2s — 2) + 26 — 2 
ist. Dann gilt also N(2s) > N(2s) fürs > 1. 
16 Ermakow, Monte-Carlo-Methode ni 


r 
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Eine. mit der Ausgangsfolge gemeinsam normale Folge konstruieren wir nun fol- 
gendermaßen in Gruppen, indem wir der Ausgangsfolge jeweils darunterstehend eine 
zweite Reihe zuordnen. 


Ö1 + ÖN2)—1 > 


0.G 3 
De “ ÖN(2)—1 > 


u In) dan)» ÖBmHHl , Öan@)+42 Syn» 
. ru e 
Pr ÖN(2)+1 ++ ÖBN2)+1> BIN) +2 + > N) +B  Öyug> 
2. Gruppe Fe „ Ösxiay > doyayrı ... dya +2? Öuya+3 es di ’ 
Öfayre “.. ÖsFay+2 ’ OsFH+3 Öyay+a ’ dns da dx) +1 ' 


Wir beweisen nun, daß wir so zwei gemeinsam normale Folgen erhalten haben. 
Dazu stellen wir zwei feste Klammern 4, und 4; in einer Matrix 


> (a 


zusammen. Wir setzen nun @ = 3" (28) +22 — 2,n = 0,..,ns21 — 1, und bezeich- 
nen mit G(2) die Anzahl des Auftretens von D, in einer Kette vom Rang k und der 
Länge & im System (7.1.21). Dann wählen wir s = k und bezeiehnen mit L die An- 
zahl des Auftretens von D, bis zum Glied mit dem Index N(2k) — 1. Das Auftreten 
von 4; in einer Gruppe mit dem Index s bedeutet, daß an den entsprechenden Stellen 
der Kette vom Rang 2s von der Ausgangsfolge eine der g2(s=#) Kombinationen der 
Art 
Ag ... Ay ... 


—— 
s Elemente s Elemente 


erscheint (möglicherweise außer den 2s letzten Gliedern der Gruppe). Auf jedem 
durch ein Komma geteilten Abschnitt tritt diese Kombination weniger als CRq-2-mal 
auf, wobei R die Anzahl der Elemente in diesem Abschnitt bedeutet. Die Anzahl 
soleher Kombinationen beträgt q9?@6-%), daher kommt 4; nicht öfter als 6-WCRg-& 
= O.Rq=?%k-mal vor. Dann gilt @(x) < L + Oxg”?% + O(s?), wo bei der Summand durch 
den Übergang von einer Gruppe zur anderen entsteht. Damit ergibt sich 
Ga) _L , fa 8? 
a 2,70% *+0(&) 

mit s?/v — 0, da x > (32° mit einer Konstanten 0, gilt. Also gilt lim G(=)/® < lg 
für x > oo, und unsere Behauptung ist bewiesen, wenn die Bedingungen des Satzes 7.4 
erfüllt sind. Das wird aber genauso geprüft, wie das beim Beweis der Normalität der 
Folge von CHAMPERNOWNE geschah. 

Nimmt man also beispielsweise als Ausgangsfolge die Folge von CHAMPERNOWNE, 
so kann man ein unendliches System gemeinsam normaler Folgen konstruieren und 
folglich eine vollständig gleichverteilte Zahlenfolge. 


Eine vollständig gleichverteilte Folge bildet eine universelle Folge, mittels derer 
man Riemannsche Integrale beliebiger Vielfachheit (darunter abzählbar unend- 
licher) berechnen kann. Es ist zu bemerken, daß es für beliebige im Lebesgueschen 
Sinn integrierbare Funktionen eine solche universelle Folge nicht gibt. Das folgt 
aus der einfachen Tatsache, daß eine durch eine diskrete Punktfolge gebildete 
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Menge das Lebesguesche Maß Null hat. Daher gibt es immer eine im Lebesgueschen 
Sinn integrierbare Funktion, die auf dieser Punktmenge gar nicht definiert ist. 
Offensichtlich muß die Zahlenfolge, die wir durch die Realisierungen einer auf 
[0, 1) gleichverteilten Zufallsgröße bilden und für die Berechnung einer hinreichend 
umfangreichen Aufgabenklasse benutzen wollen, Eigenschaften besitzen, die im 
gewissen Sinn den Eigenschaften einer vollständig gleichverteilten Folge nahe- 
kommen. Die Natürlichkeit dieser Forderung wird auch durch folgende Über- 
legungen unterstrichen: Aus dem starken Gesetz der großen Zahlen folgt, daß die 
Folge der Realisierungen einer auf [0, 1) gleichverteilten Zufallsgröße mit der 
Wahrscheinlichkeit 1 eine vollständig gleichverteilte Folge ist. Es sei nämlich 
&% = &1,&g, . . . eine solche Folge und (a,, ..., 8)» (Xgs +++, &s +1), » - - eine Kette vom 
Rang s. Dann gilt für jede im Riemannschen Sinn über dem s-dimensionalen 
Einheitswürfel 2, integrierbare Funktion mit der Wahrscheinlichkeit 1 
e 
lim 1 3 Kon ..,%sr1) = SFR) de, (7.1.25) 
>00 N iQ Ds 
da die Klammern der Kette Realisierungen von nicht mehr als s abhängigen 
Zufallsgrößen darstellen (Kap. I, $ 3). Schließlich ist im Zusammenhang mit dem 
Begriff der vollständigen Gleichverteilung folgende von N. N. TscHhexzow [2] 
betrachtete Aufgabe von unmittelbarem Interesse. 


Gegeben ist eine homogene Markoffsche Kette mit einer endlichen Anzahl von 
Zuständen y,i =], ...,n, und der Übergangsmatrix P = ((py)). Mit dem schon 
mehrfach beschriebenen Verfahren wird nun die Markoffsche Kette durch eine 
Zahlenfolge & = &,, &, - . - (0 < &,<{ 1) modelliert, d. h., man modelliert die Folge 
der diskreten Verteilungen nach Formel (2.2.6), wobei man als Zufallszahlen die 
Zahlen der Folge & wählt. Weiterhin werden wir dieses Modellierungsverfahren als 
Standardverfahren bezeichnen. Wir setzen noch voraus, daß die Matrix 7 ergo- 
disch ist, es existiert also eine eindeutige stationäre Wahrscheinlichkeitsverteilung 
{q},®=1,...,n. Wie schon früher bemerkt wurde, kann man sich bei der Be- 


N 
rechnung des Mittelwerts 3% q,f(w;) über die unbekannte stationäre Verteilung 
1 


der Kette auf die Modellierung einer einzigen Trajektorie beschränken, die nur 
von hinreichend großer Länge sein muß. Unsere Aufgabe besteht nun in folgen- 
dem: Welche Beschränkungen ergeben sich für die Folge & aus der Forderung, 
daß für eine beliebige Markoffsche Kette mit ergodischer Matrix und beliebiger 
Anfangsverteilung bei der Modellierung mit dem Standardverfahren für jede Wahl 
der Funktion f(») die Beziehung 


FE a; N k 
lim N 2 ya) = & qiflo:) (7.1.26) 
Now 4 k=1 i=1 


erfüllt ist ? Dabei bilden die y;,, k = 1, ..., N, die Folge von Zuständen der Kette, 
die sich durch die Modellierung ergeben. Die Lösung dieser Aufgabe liefert der 
folgende Satz, der hier ohne Beweis angegeben wird. 


Satz 7.6. Genau dann erhält man mit dem Standardverfahren bei der Modellierung 
einer beliebigen Markoffschen Kette "mit endlich vielen Zuständen und eindeutiger 


16* 
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stationärer ‚Wahrscheinlichkeitsverteilung eine ergodische Trajektorie im Sinn von 
(7.1.26) (schwach ergodisch), wenn die Folge & vollständig gleichverteilt ist. 


Die Konstruktion normaler, gemeinsam normaler und vollständig gleichverteilter 
Folgen in dem oben beschriebenen Sinn bildet ein arithmetisches Modell einer 
gleichverteilten Zufallsgröße. Wie wir sahen, ist ein Modell solcher Art recht 
kompliziert, und gewöhnlich muß man sich auf gröbere und angenäherte Modelle 
beschränken (mehr dazu in $ 2). 

Demgegenüber ist es günstig, daß sich die Modellierung einer verhältnismäßig 
komplizierten Erscheinung, wie sie die Brownsche Bewegung darstellt, recht 
einfach verwirklichen läßt. Ergebnisse zur arithmetischen Modellierung der 
Brownschen Bewegung wurden von I. P. Kugıtsus und J. W. Livxık [1] erhalten. 
Dieses Modell wollen wir nun kurz beschreiben. 

Es sei p eine Primzahl, 9 >2. Das Legendresche Symbol (m/p) der Zahl m 
in bezug auf p ist gleich 1, wenn m quadratischer Rest ist, gleich 0 für m = 0 
und gleich —1, wenn m quadratischer Nichtrest ist. Das Symbol (m/p) ist also 
bei festem p eine periodische Funktion mit der Periode p des ganzzahligen Argu- 
ments m, definiert durch 


0 füm=0, 
m = 2— li! 
—|=! 1 für m=1 28% .,„I——], 
? 2 


—1l sonst. 
Ferner sei .R eine ungerade quadratfreie Zahl und R = p,P3 :-' 9, die zugehörige 
Primfaktorenzerlegung. 
Das Jacobische Symbol wird dann durch 


Dlalremle 


definiert, wobei die Faktoren auf der rechten Seite Legendresche Symbole sind 
(Rjp bedeutet, daß p alle Primteiler von R durchläuft). Das Legendresymbol ist 
daher ein Sonderfall des Jacobischen Symbols. Das gesuchte Modell wird nun 
mit Hilfe der Summen 


1 m+n 
Srlm, 8,1; h)—= — ———]; 0< t, 

BURMAUR En Ze £ ) Ss< 
gebildet. Dann gilt folgender Satz: 


Satz 7.T. R soll eine beliebige wachsende unendliche Folge ungerader quadratfreier 
Zahlen durchlaufen, so daß für jedes feste c > 0 


I (1 = ) —1 
Rip pP 
und h = h(R) — ®, log h/log R —0 für R— © güt. Dann erhält man 


z= 
1 r 
P(Sptm, s,t;h 2) ME TER [ een au 
(Sat )<e) er 


x 


$2. Lineare Rekursionsformeln zur Erzeugung von Pseudozufallszahlen 245 


und bei beliebiger Wahl disjunkter Intervalle 
(1: E)ı er (Sr 1a) » 0<u<i, j=l,..k, 
P(Sr(m, 53, 11; Rh) < 1 +, Sr(M, Sr, ba; h) < xx) 


k 
— II lim P(Sr(m, 875 t;; h) < x;) . 
j=z1 R>o 
Dieser Satz beschreibt eigentlich eine Familie von Modellen der Brownschen Be- 
wegung. KUBILJUS und LInNIKk haben solche Modelle aufgestellt, die mit den 
Restsymbolen höherer Potenzen verknüpft sind. Die Frage danach, welche der 
Modelle in numerischer Beziehung am günstigsten sind, bedarf noch einer genaueren 
Untersuchung. 


$2. Über lineare Rekursionsformeln zur Erzeugung von Pseudozufallszahlen 


1. Folgen von Zahlen mit beliebig vielen Ziffern. In diesem Abschnitt werden 
wir uns mit Folgen beschäftigen, die durch eine eindeutige rekursive Beziehung 
erzeugt werden. Zunächst betrachten wir eine Folge &= £,,&,... von Zahlen 
mit beliebig vielen Ziffern und nehmen an, daß diese Folge rekursiv durch die 
Formel 


ee Mini) =], ..; (7.2.1) 


mit festem m > 1 erzeugt wird. Natürlich wird man versuchen ein solches F zu 
wählen, daß die Folge & in gewissem Sinn die Eigenschaften der Gleichverteilung 
erhält. Aber schon das vollständige Hinschreiben der Bedingungen, die durch die 
Forderung der Gleichverteilung an F zu stellen sind, ist offensichtlich recht schwie- 
rig, und wir werden eine solche Fragestellung nicht weiter verfolgen. Wir geben 
nur noch einen einfachen Satz an (FRANKLIN [1]). 


Satz 7.8 Es sei {en} eine Folge auf [0, 1) mit 
En+ı = Fe) » =0;l,:.4 


Diese Folge kann nicht p-gleichverteilt sein für beliebiges p > 1, wenn F(x) wenigstens 
einen Stetigkeitspunkt auf [0, 1) besitzt. 


Beweis. Es sei F(x) inx= a stetig, ae [0,1) und F(a)=b. Dann gibt es 
einö > 0 so, daß |F(x) — b] < 1/4 für |e — a] </ ö gilt. Wir bezeichnen nun mit I 
den Durchschnitt der Menge {x : |& — a| < ö} mit dem Intervall [0, 1) und mit I 
ein beliebiges Intervall auf [0, 1), dessen Punkte von b um mehr als 1/4 entfernt 
sind. Dann ist leicht zu sehen, daß niemals ein Punktepaar &,, &2..ı der Folge in 
dem Intervall /X I liegen kann. Damit ist der Satz bewiesen. 

Wir werden nun den einfachsten Fall einer Funktion F(x) untersuchen, wenn 
F(x) die Gestalt 


F(&«) = {Mx +9} (7.2.2) 


246 VII. Mit der Zahlentheorie zusammenhängende Fragen 


mit einer natürlichen Zahl M >1 bei beliebigem reellem 9 hat. Die Funktion 
{Mx + 9} ist in allen Punkten von [0, 1) mit Ausnahme einer endlichen Anzahl 
von M oder M — 1 Punkten stetig. Es ist auch leicht zu zeigen, daß für die Folge 
&n+ı = {Men} die Beziehung Pfe„ > enzı > &n+2) = (1 — M!)/6 gilt. Für eine 
2-Gleichverteilung müßte diese Wahrscheinlichkeit aber 1/6 betragen. Daher 
bildet eine rekursive Folge, die durch den gebrochenen Teil einer linearen Funktion 
definiert ist, nicht einmal eine 2-gleichverteilte Folge. Dennoch müssen alle 
Versuche, diesen Sachverhalt durch Wahl einer komplizierteren Funktion F zu 
ändern, zu einem Mißerfolg führen. Im Zusammenhang damit geben wir ohne 
Beweis folgenden Satz an (FRANKLIS [1]): 


Satz 7.9. Es sei p(x) ein Polynom mit reellen Koeffizienten. Wir setzen voraus, 
daß für ein gewisses &, die nach der Formel &,.1= {Ppl(e„)} konstruierte Folge der &n 
auf [0, 1) gleichverteilt ist. Dann ist entweder p(x) = x + B mit einer Irrationalzahl 
oder p(x) = Mx + B mit einer natürlichen Zahl M >]1. 


Die Zahlen &,, für die bei jedem natürlichen M>1 die durch &,+1 = {Men} 
definierte Folge der &, auf (0, 1) gleichverteilt ist, heißen absolut normal. Die 
Menge der auf (0, 1) absolut normalen Zahlen hat das Lebesguesche Maß Eins. 
Zuerst wurden solche Zahlen im Jahr 1917 von LEBESGUE und SIERPINSKI kon- 
struiert. Es ist klar, daß die durch 


nr Mn+9), 8>0, (7.2.3) 


definierte Folge analoge Eigenschaften besitzt. 

Weiterhin wird es sich zeigen, daß die Folge (7.2.3) für hinreichend großes M 
viele Eigenschaften hat, wie sie einer Folge von Realisierungen einer auf (0, 1) 
gleichverteilten Zufallsgröße zukommen. Um das zu zeigen, benötigen wir das 
folgende von SozoL [8] gefundene Resultat. 

Es sei f{@) eine im s-dimensionalen Einheitswürfel 2, definierte und dort im 
Riemannschen Sinn integrierbare Funktion. Wir setzen 


Pulz) = Ma, {Me}, (MMaR}, , (Mi-Ms-ı®)) 


wobei M,, Mg ..., M,_ı natürliche Zahlen sind und M = min (M, .-, Ms) <1 
gilt. Mit den Bezeichnungen 


J=/ fx) de und Ju = fuer dx 
Ds 0 


gilt der folgende Satz. 


Satz 7.10. Sind unter den angegebenen Vorausselzungen für ein gewisses M, Z 2 
und alle M > M, alle gu(x) im Riemannschen Sinn über (0, 1) integrierbar, dann 
giüt 

lim Ju =)J. 
Mo 

Beweis. Wir zerlegen das Intervall (0, 1) in M, gleiche Intervalle und ent- 

sprechend J, in eine Summe von M, Integralen. In jedem Teilintegral wird die 
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Substitution M,x — j, + yı durchgeführt. Damit erhält man 
_, hen 


Ju = 2 f oml®) de 


1 M-1 3: 
-"nS iz Yı sYis ses fz--Mu-n) )dn 
ö 


In gleicher Weise wird jedes der sich ergebenden Integrale in eine Summe von 
M, Integralen zerlegt und in jedem Teilintegral die Substitution May, = ja + Ya 
durchgeführt. Dann erhält man 


1 N ! ( +Y »+Y 
—— P» 2. 1 2 2 
Ju MM,;=0 Pr fi u, ’ u, Ya (My Ms a) Abe. 


Wenn man diesen Prozeß s-mal wiederholt (beim letzten Mal wird jedes Integral 
in M Teile zerlegt), so ergibt sich 


1 te (dh, ht von er 
J 1 1 A: e—1 s-ı Is + r%Ys , 
ME 5 free M,-ı a) 


Nun seien M(j,, »--, 75) und M(jj, ++. Js) die obere und die untere Grenze der Funktion f 
im Parallelepiped 
ir je +1 
M; s %r = aM. ’ 


Hr 


k=1..s,, M=M, 


Offensichtlich = 

M,-1 

a z m{j, 5) Me MMS Ju 

yi= js=0 

M-ı M-ı 
SE Mid) MM). 
h= = 
In dieser Ungleichung steht rechts und links die obere bzw. untere Darbouxsche 
Summe für fin 2,. Daher strebt Ju für M — x gegen J. 
FranKLim [1] zeigte 1963, daß die Folge (7.2.3) für M — oo vollständig gleich- 

verteilt ist. Wir werden hier den Beweis einer etwas allgemeineren von SoBor [8] 
gefundenen Aussage angeben. Dazu führen wir die Bezeichnung 


Ir. = (&x; ..., Ek+s—1) und % = (Ers+1> .... &(k-+1)s) 
ein und nehmen M, = M,= + = M,-ı = M an. Dann gilt folgender Satz. 


Satz 7.11. Ist f(x) im Riemannschen Sinn über D, integrierbar und sind für ein 
gewisses M,>2 und alle M > M, alle gm im Riemannschen Sinne über (0,1) 
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integrierbar, dann = = fast alle e, aus (0, 1) 
1-1 
lim lim — v2 = und lim lim Fi 2 He 


Mo N>0oN Mo m 
Beweis. Es sei &, eine absolut normale Zahl. Dann gilt 
Fa) = IHM eo), u, {Mt Re}) = Pu He) = Pulerıı) - 


Da die Folge & gleichverteilt ist, ergibt sich daraus die erste Aussage des Satzes, 
d.h. das erwähnte Resultat von FRANKLIN. 


Nun setzen wir M'= M. Dann gilt 


fir) = MM}: {M’Mes}) = Yul{MM*es)). 


Ist aber die Folge {M*e,} gleichverteilt, so ist auch die Folge {M*e,} gleichverteilt 
(vgl. Postntkow [2]). Nach dem Weylschen Kriterium ergibt sich für beliebiges 
natürliches m > 0 


v-1 
5 exp (2mime,M*) = o(N) ; 


k=0 


insbesondere gilt diese Gleichung für alle m = m,M +0. Das bedeutet aber, 
daß auch die ne -. *eo} gleichverteilt ist. Wie schon oben folgt daraus 


lim lim — =: eye J, 


M->o0 N-+oo N k=0 


und der Satz ist bewiesen. 


Die folgenden beiden Sätze, die vom Autor gefunden wurden, erlauben es, eine 
Aussage Ber die Grenzverteilung des arithmetischen Mittels 


1# 
für M— oo und N — oo zu machen. 
Lemma 7.3. Ist {M*x}, ..., {M"ts-12}), k> 0, im Riemannschen Sinn über 
(0, 1) integrierbar, so gilt die Beziehung 
1 1 
SIUMFR}, .., {Mt lg)) de = S He, {Mer}; ..., {M°'x}) de 
{) 0 
Zum Beweis genügt es, (0, 1) in M* gleiche Intervalle zu zerlegen und dann wie 


beim Beweis von Satz 7.10 vorzugehen. 
Wir führen nun die Bezeichnung 
1 
Julms.., me] S Pr {Mer}, ..., {Müts12}).. fm {Mix}, ..., (M%ts12))de 
0 
ein. Dabei sind m,, .--, Mg; %s +, %. natürliche Zahlen mit +8 S%+, P = 


=1,..,k — 1, und die Existenz des Integrals wird vorausgesetzt. (Die Funktion f 
soll außerdem in D, beschränkt sein.) 
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Lemma 7.4. Bei beliebiger Wahl der natürlichen Zahlen m,, ..., My gilt die Be- 
ziehung 


lim J ulm; -.-, mx] = ie de. me de. 
M->% 


Beweis. Nach Lemma 7.3 kann man die Potenz von M in dem Ausdruck für 
J ulmy; ..., M;] reduzieren. Der weitere Beweis ergibt sich dann aus Satz 7.10, 
wenn man berücksichtigt, daß der Integrand eine Funktion 9, ist, die einer Funk- 
tion von ks Veränderlichen 


fr(lz{), ..., 29) -- mem, ..., 29) 
entspricht. Wir betrachten nun die Differenz 


13-1 N- 


Fr ai) -I=- 72 DICH 


mit f(@) = f{@) — J. Nach Lemma 7.4 gilt 


2 1 X-1 p N-1, p 
lim Ir & f(&) 7) de [an (are | Ten] =],[N]- 
M- co N x<Zo k=0 
0 Ds Ds 


Ist & eine in D, gleichverteilte Zufallsgröße und wird E=f{&) gesetzt, so ist 
],[N] das p-te Moment as ne von £&. Daraus ergibt sich 


„lm mes ou 14 2,16) < )- FW); (1.2.4) 
wobei Fy(y) die Verteilungsfunktion des Stichprobenmittels von & ist. Für hin- 
reichend große N nähert sich diese Verteilung einer Normalverteilung mit dem 
Erwartungswert Null und der Dispersion 


of=N Fi (fa) — J)? ae]: 


x-ı 
Es ist leicht zu schen, daß für den Mittelwert N! 3% /(&,) (die &, werden aus 
k=0 


der Folge &=&,, &,, ... nach der Vorschrift &;=(&+ +1, ..., &-5) gebildet) ein anderes 
Resultat gilt. Die entsprechenden Zufallsgrößen € sind dann s-abhängig. 


Die im ersten Kapitel beschriebenen linearen Rekursionsverfahren zur Erzeu- 
gung von Pseudozufallszahlen können in gewissem Maß durch diese Resultate 
begründet werden. Man kann hoffen, für diese Verfahren solche Parameter zu 
finden, daß sich eine asymptotische Normalverteilung ergibt. Es ist klar (und 
das wurde auch mehrfach in der Literatur behauptet), daß man dann gute Resul- 
tate bei der Berechnung von Pseudozufallszahlen mit einer großen Anzahl gültiger 
Ziffern erwarten kann. Diese Frage bedarf aber noch weiterer Untersuchungen. 
Anschließend gehen wir kurz auf Resultate ein, die sich auf Pseudozufallszahlen- 
folgen beziehen, wenn die Berechnung mit einer festen endlichen Ziffernzahl durch- 
geführt wird. 
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2. Folgen von Zahlen mit endlich vielen Ziffern. Ihre Periodizität. Die Folge 
der Gestalt (7.2.3) besitzt bei einem festen M unter der Voraussetzung, daß ihre 
Glieder mit endlicher Ziffernzahl berechnet werden, die wichtige Eigenschaft eines 
außerordentlich einfachen Rechenverfahrens. Aus diesem Grund wird die genannte 
Folge recht oft bei der Lösung praktischer Aufgaben mit der Monte-Carlo-Methode 
benutzt. 

Wie sich aus den früher beschriebenen Beispielen konkreter Aufgaben ergibt, 
bildet die Einfachheit des Algorithmus zur Erzeugung von Pseudozufallszahlen 
eine nicht unwichtige Eigenschaft. Zugleich fehlen aber Resultate, die eine Be- 
schreibung der Funktionenklasse gestatten, für die die näherungsweise Integration 
mit Hilfe solcher Folgen zu einem konvergenten Verfahren führt. Obwohl eine 
Reihe von Folgen durch statistische Teste geprüft wurde (ausführliche Angaben 
darüber folgen in diesem Abschnitt), ist bei ihrer Anwendung eine gewisse Vor- 
sicht notwendig, insbesondere in den Fällen, in denen die Rechenergebnisse nicht 
mit entsprechenden experimentellen Daten verglichen werden können. 

Wir geben anschließend nur Resultate an, die sich auf die Periodenlänge der 
durch lineare Rekursionsformeln erzeugten Folgen beziehen. Nur kurz gehen wir 
auf einige andere Untersuchungen ein, die diese Verfahren betreffen. 

Die nun folgenden Resultate können auf verschiedene Weise aus den Ergebnissen 
der elementaren Zahlentheorie hergeleitet werden. Eine der einfachsten Darstel- 
lungen findet sich in der Monographie von Jaxssox [1], der wir im wesentlichen 
folgen. 


Wir kommen nun auf die Verfahren zur Erzeugung von Pseudozufallszahlen 
zurück, über die wir kurz im ersten Kapitel berichteten. Wir betrachten eine 
Folge X = x, 2, . . . ganzer Zahlen, die durch die Beziehung 

In EMgen + in -ı +" + ana +b (mod P) (7.2.5) 
mit nichtnegativen ganzen Zahlen P, ag ..., Ay D, %s +++, & definiert ist. Die Rela- 
tion x = y (mod P) bedeutet in diesem Fall, daß x der Rest ist, der bei der Division 
von y durch P entsteht. Daher sind die Glieder der Folge X nicht größer als P, 
und die Zahlen z/P,i=k+1,k +2, ..... werden gewöhnlich als Pseudozufalls- 
zahlen auf dem Intervall (0, 1) benutzt. Für k = 0 ist unschwer die Analogie 
zwischen der Folge (7.2.5) und der im vorigen Abschnitt betrachteten Folge festzu- 
stellen. 

Wir werden nun voraussetzen, daß die größten gemeinsamen Teiler (x; ..., &x, d, P) 
und (Ay ..., dp, P) der Zahlen x, ..., 2% db, P bzw. ag... Gr, P gleich Eins sind 
Um die Abhängigkeit der Resultate von P hervorzuheben, werden wir die Folge X 
selbst mit X(P) und ihre Periodenlänge mit L({P) bezeichnen. Sind die Prim- 
faktoren von P kleine Zahlen, so kann das Verfahren zur Bestimmung von L(P) 
leicht auf ein einfaches Verfahren zur Bestimmung der Periodenlänge dieser 
kleinen Faktoren zurückgeführt werden. Zu diesem Zweck beweisen wir bei festen 
Werten x, ..., &; folgendes Lemma: 


Lemma 7.5. Es seien m, und m, positive ganze Zahlen, (m,, mg) = 1 und L(m,) 
und L(m,) die Periodenlänge von X{m,) bzw. X(m,). Dann ist L(m,m,) = k.g.V. 
(L(im,), L(m,;)), wobei k.g.V. das kleinste gemeinsame Vielfache der darauffolgenden 
Zahlen bedeutet. 
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. Beweis. Wird 
Yn+ı = Aa +" + Arya- +5; nZk, Yn = Ins Osn<sk, 


(7.2.6) 

gesetzt, dann gilt nach den Voraussetzungen des Lemmas 
Yirz um) = Boten, sm » (7.2.7) 
Yi+1Lm,) Tito, ım, (7.2.8) 


für ©=0,1,...,k, wobei c;; und c;; ganze und j und Z natürliche Zahlen sind. 
Außerdem gilt 

Yi + Limym;) — Ki+emm, (7.2.9) 
mit einer ganzen Zahl c,. L(mm,) ist die kleinste ganze Zahl, für die die Bezie- 


hungen (7.2.7) bis (7.2.9) erfüllt sind, also k.g.V. (L(m,), L(m,)), womit das Lemma 
bewiesen ist. 


Aus dem Lemma ergibt sich leicht eine Folgerung 
8 
Folgerung. Ist P= 3 p* die Primfaktorenzerlegung der Zahl P, dann ist 
i=1 
L(P) = k.g.V. (L(p"), ..., L(ple)) . 


Der für uns wichtige Fall mehrfacher Faktoren wird in den folgenden beiden 
Lemmata untersucht. 


Lemma 7.6. Wenn die Folge X(p”) die Periodenlänge L(p”) besitzt (p Primzahl, 
m natürliche Zahl), dann ist die Periodenlänge der Folge X({p"+!) entweder auch 
gleich L(p") oder aber p-mal größer. 

Beweis. %„..1 ist wie oben durch (7.2.6) definiert. Dann gilt 

Yizjlipm) = %iteor,zpm > v= 0, ...; k ’ 
wobei c;,; nichtnegativ ist. Ist c,,, für alle ? durch p teilbar ist, dann gilt Z(p" +1) 
= L(p”). Andernfalls gibt es eine natürliche Zahl r, für die c,ı=r (modyp) und 
folglich c,;=rj (mod p) gilt. Weil p eine Primzahl ist, gilt jr == 0 (mod p) für 
j=1,2,.,p—1 und fr=0 (modp) für j=p. Daraus ergibt sich L(p"+t) 
— pL(p”), womit der Beweis beendet ist. 


Lemma 7.7. Gilt für die Periodenlänge L(p"+!) = pL(p"), so folgt daraus 
L(p'"®) = p!L(p") mit natürlichen Zahlen I und m. 


Beweis. Für Z= 2 erhält man unter Beibehaltung der vorherigen Bezeichnun- 
gen ,»= pr (mod p”). Folglich ist c;,;» = jpr (mod p)". Daraus folgt wie beim 
Beweis von Lemma 7.6 jpr = 0 (mod p"),j= 1,2, ...,p — 1, und gleichzeitig ppr 
= (0 (mod p'). Der Beweis für 2>2 kann leicht mit vollständiger Induktion 
geführt werden. 


Wir gehen nun auf den wichtigsten Spezialfall, auf die Folge 
%n+1ı = Mx, (mod 2”) (7.2.10) 
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ein. Die Untersuchung dieser Folgen für m = 1, 2, 3, 4 und verschiedene Werte 
für M liefert folgendes Resultat: 


Perioden- 

m M | Zusammensetzung der Folge länge 
1 | Y 1.3453: 1 
2 1 a Dog: 3921 FWRBN 1 
3 1,:8,.1,4%% 2 
3 1 Alu leise 1 
3 1, 3 oder 5, 7 2 
5 1, 5 oder 3, 7 2 
7 1, 7 oder 3,5 2 
+ 1 1,15, 1%. 1 
3 1, 3, 9, 11 oder 6, 15, 13, 7 4 
5 1, 5, 9, 13 oder 3, 15, 11, 7 4 
7 1, 7 oder 3, 5 oder 9, 15 oder 11, 13 2 
9 1, 9 oder 3, 11 oder 5, 13 oder 7, 15 2 
11 1, 11, 9, 3 oder 5, 7, 13, 15 4 
13 1, 13, 9, 5 oder 3, 7, 11, 15 4 
15 1, 15 oder 3, 13 oder 5, 11 oder 7, 9 2 

Tabelle 7.1 


Daraus kann man auf Grund der eben bewiesenen Lemmata leicht folgende 
Behauptung ableiten: Die maximale Periodenlänge der Folge (7.2.10) ergibt sich 
für m >3 zu 2”=2, Diese Länge wird für M = 3 (mod 8) oder M = 5 (mod 8) 
und für alle ungeraden x, erreicht. In analoger Weise kann man auch die Folge 


Zn+ı = Max, + b (mod 2") (7.2.11) 


untersuchen, wobei sich folgendes Resultat ergibt: Die maximale Periodenlänge 
der Folge (7.2.11) beträgt 2” und hängt nicht von x, ab. Diese Länge wird für 
M = 1(mod4) und b=1(mod 2) erreicht. Für Rechnungen auf Anlagen mit 
Dualzahlenarithmetik sind die angegebenen Resultate sehr interessant. Von 
Interesse sind auch Aussagen über die Zusammensetzung der entsprechenden 
Folgen im Fall maximaler Periodenlänge. Ohne Beweis geben wir die entsprechen- 
den Resultate an. 

Für die Folge (7.2.10) gilt: 

1. Wenn M =3(mod 8) und x,=1,3,9 oder 11 (mod 16) ist, dann besteht 
die Folge aus den Zahlen 8% + 1 und $k + 3 für k = 0,1, ..., 27-3 — 1. 

2. Wenn M =3 (mod 8) und x, = 5, 7, 13 oder 15 (mod 16) ist, dann besteht 
die Folge aus den Zahlen 8% + 5 und 8k + 7 für k=0,1,...,2”-3 — ]. 

3. Wenn M =5 (mod 8) und 20 =1(mod 4) ist, dann besteht die Folge aus 
den Zahlen 4k + 1für k = 0,1], ..., 2%? — 1. 

4. Wenn M =5 (mod 8) und Rz = u en 4) ist, dann besteht die Folge aus 
den Zahlen 4k +3 für k = 0,1, 
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Die Folge (7.2.11) besteht natürlicherweise (im Fall maximaler Periodenlänge) 
aus allen Zahlen von O bis 2" — 1. 


Es gibt eine große Anzahl von Arbeiten, in denen statistische Teste zur Unter- 
suchung der Folgen benutzt werden, die durch lineare Rekursionsformeln für ver- 
schiedene Parameterwerte erzeugt werden. Am vollständigsten wurden die Folgen 
der Gestalt (7.2.10) untersucht. Wir beschränken uns hier nur auf Hinweise auf 
einige Literaturstellen (hauptsächlich niehtsowjetische), wo solche Untersuchungen 
durchgeführt wurden oder die Benutzung linearer Rekursionsformeln beschrieben 
wurde. Diese bibliographischen Hinweise sind in Tabelle 7.2 (nach verschiedenen 
Werten für M und P geordnet) zusammengestellt. Eine weitere Bibliographie 
hierzu kann man bei Jawssox [1] finden. Beim praktischen Rechnen ist einer der 
am meisten gebrauchten Werte M = 51° mit P = 2% oder P = 2%. Die Autoren 
heben für diesen M-Wert gewöhnlich die zusätzliche Erfüllung verschiedener 
statistischer Teste oder die gute Übereinstimmung mit dem Experiment hervor. 
Aussagen über Folgen der Gestalt (7.2.11) mit 5 -- 0 kann man auch in der in 
Tabelle 7.2 genannten Literatur finden. 


M P | Autor 
513 239 JuncosA [1] 
517 248 Tavssky und Topp [1] 
23 235 11 JoHnson [1] 
319 1020 BorFIxGer [1] 
25 2521 — 1 ESMENJAUD-BONNARDEL [1] 
23 108 +1 MAOoLAREN und Marsacııa [1] 
217 + 3 235 
105 + 3 1020 } Covzyou und MACPHERSoRX [1] 
515 935 
6469693 231 236 ERMAKOw und PROKOFJEWA [1] 
5 240 MARTSCHUK u.a. [1] 
1050005 285 GELDER [1] 
1000003 
551003 
551023 
400003 
200 003 
20405 
20005 
20003 | 
10405 | 
10005 | 
10003 
6263 
4005 
4003 
2003 
203 


Tabelle 7.2 
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Analytische Untersuchungen, die mit den „pseudostatistischen Eigenschaften“ 
der Folgen verbunden sind, werden beispielsweise in den Arbeiten von GOLENKO 
[1], Janssox [1], Coveyou und MAcPHERSoN [1] durchgeführt. Unter pseudo- 
statistischen Eigenschaften einer Folge versteht man Eigenschaften integraler Art, 
die über die volle Periode berechnet werden. Solche Eigenschaften entsprechen 
gewöhnlich den Momenten einer Zufallsgröße. Wenn Z die Periodenlänge der 
Folge ist und die Folge alle Zahlen 1, ..., Z enthält, dann ist das Analogon des 
Erwartungswertes 


© 1 1 2 L 1 
M=— I u=— NVi=-——. 
u 7 Me 
Entsprechend setzt man 
2 - - 2 1ı 
=, Bi. En nn 
Dir = Ma? — (M%)? — Th 


Was die Kovarianz zwischen den n-ten und (n + k)-ten Gliedern der Folge betrifft, 
so hängt der entsprechende Ausdruck von der Gestalt der Formel ab, nach der 
die Folge berechnet wurde, also insbesondere von den Konstanten M und b. Die 
Herleitung dieser Kovarianzformeln ist eine recht schwierige Aufgabe. Für die 
Folgen (7.2.10) und (7.2.11) wurden analytische Methoden zur Berechnung der 
Kovarianz coV (%, 2,2) von JANSSON [1] ausgearbeitet. Auf einer EDVA unter- 
suchte er die empirische Verteilung der Korrelationskoeffizienten 0,, die in den 
meisten Fällen genügend gut mit der theoretischen Verteilung übereinstimmte. 
Weil 5, von den Konstanten M und b abhängt und die Berechnung von 9, auf der 
Grundlage theoretischer Formeln erfolgen kann, können solche Berechnungen zu 
einer sinnvollen Auswahl dieser Konstanten benutzt werden. Ein anderer Weg, 
der auch von den Mittelwerten über eine vollständige Periode der Folge ausgeht, 
wurde von CovEyou und MACPHERSoN [1] vorgeschlagen. Dort wird die Über- 
einstimmung der Verteilung von nach Formel (7.2.5) erzeugten Folgen mit Hilfe 
einer sogenannten Wellenzahl charakterisiert. 


Es sei z eine Veränderliche, die die ganzzahligen Werte 0, ..., ZL — 1 annimmt. 
Dann gilt z/L e [0, 1). Wir führen nun das diskrete Maß w,(dz) ein, das in jedem 
Punkt z/L den Wert 1/Z hat und erhalten so folgendes Lemma. 


Lemma 7.8. Die Funktion fx}, ..., 25) sei in den Punkten (z,[L; ..., z,/L) de- 
finiert, wobei z,, ..., 2; ganzzahlige Werte zwischen O und L— 1, L>0, sind. Dann 
ist in jedem der genannten Punkte die Gleichung 

3 L-1 
le en [a 9) 2.12 
16 y 2) = 3  erlm)exp (2m L (7.2.12) 


Man M—=Ü 
erfüllt (Zerlegung in eine endliche Fourierreihe). Dabei sind die 
a SE Fe k; 9. (mM, k) 
c,(m) — % RR (2 ..., 7) exp [= m) 


die endlichen Fourierkoeffizienten der Funktion f. 
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Der Beweis folgt aus der Orthogonalität des Funktionensystems {exp (Arikz)} 
bezüglich des Maßes u,(dz). Die Gleichverteilung bezüglich des Maßes u,(dz) (mit 
der Dichte 1) ist natürlicherweise als Näherung für die Gleichverteilung auf [0, 1) 
zu betrachten, als ihr diskretes Analogon. Außerdem muß 1 die Dichte der ge- 
meinsamen Verteilung von Paaren, Tripeln usw. bis zu Z-Tupeln (l< L) bezüglich 
des Produktes einer entsprechenden Anzahl von Maßen u, sein. - 

Es seien 9, (&1); 92(21: 23)» +++ (21; -.-, 2) die empirischen Dichten der gemeinsamen 
Verteilungen bezüglich des Maßes (z,),, die einem konkreten Algorithmus zur 
Erzeugung von Pseudozufallszahlen entsprechen. Bei der Zerlegung dieser Dichten 
in eine Fourierreihe nach (7.2.12) werden nicht alle höheren Fourierkoeffizienten 
Null, sondern einige davon werden Eins sein. Es seien m — (My, ..., M,) die 
Werte m, für die die zugehörigen Fourierkoeffizienten Eins sind. Man setzt nun 


A 1 as e 5 
= FT (Mm + Hm) TUR 
und nennt die Größe A die Wellenzahl. Die Werte dieser Zahl können die Güte 
des Algorithmus zur Erzeugung von Pseudozufallszahlen charakterisieren. Ofien- 
sichtlich darf eine gute Folge keine kleine Wellenzahl haben. CovEeyou und 
MACPHERSoN [1] haben die minimalen Wellenzahlen für einige Algorithmen ana- 
lytisch oder auf einer EDVA berechnet. Dort werden auch einige Abschätzungen 
der minimalen Wellenzahl nach unten angegeben. Eine harmonische Analyse 
dieser Art ist jedenfalls leichter durehführbar als die unmittelbare Untersuchung 
der gemeinsamen Verteilungen von Pseudozufallszahlen. 

Aus dieser kurzen Darstellung einiger Resultate über lineare Rekursionsformeln 
kann man schlußfolgern, daß ihre Anwendung in: der Monte-Carlo-Methode im 
Grunde genommen auf einem „experimentellen“ Vorgehen beruht (vgl. Kap. II, 


sı). 
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Wie in $1 gezeigt wurde, ist die Benutzung einer vollständig gleichverteilten 
Folge als Folge von Realisierungen der Zufallsgröße«x praktisch in allen Fällen 
sinnvoll. Freilich muß die Einschränkung gemacht werden, daß die Geschwindig- 
keit der Konvergenz des arithmetischen Mittels gegen das entsprechende Integral 
im allgemeinen von der Konstruktion der Folge und den Eigenschaften des Inte- 
granden abhängt. Die in $1 beschriebene theoretische Konstruktion ist für 
praktische Rechnungen allerdings nicht verwendbar. 

Die in $ 2 ausführlich beschriebenen linearen Rekursionsverfahren haben eine 
gewisse Beziehung zu den vollständig gleichverteilten Folgen. Die mit diesen 
Verfahren erzeugten Folgen x,, &, ... mit endlicher Ziffernzahl werden sehr oft 
zur Lösung praktischer Aufgaben benutzt. Leicht ist aber folgendes zu sehen. 
Wenn die Größe z,(m, + m; M + --- + m,M°-1)/P eine ganze Zahl ist, dann führt 
die Integration der Funktion exp (2ri(m;x + + + msx,)) mit Hilfe solcher Folgen 
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zu keinem Erfolg. Der genannte Zusammenhang der linearen Rekursionsver- 
fahren mit den vollständig gleichverteilten Folgen hat offensichtlich nur quali- 
tativen Charakter, und in dieser Richtung sind noch weitere Untersuchungen 
notwendig. Das Problem, das hier entsteht, besteht in folgendem. Es gibt eine 
Methode der näherungsweisen Integration, die sehr einfach auf einer EDVA zu 
realisieren ist. Dann entsteht die Forderung, eine möglichst umfangreiche Funk- 
tionenklasse anzugeben, für die diese Integrationsmethode brauchbar ist. Der 
Begriff der Brauchbarkeit muß freilich erst in entsprechender Weise formalisiert 
werden. 

Neben den durch lineare Rekursionsverfahren erzeugten Folgen werden bei der 
Anwendung der Monte-Carlo-Methode praktisch auch einige andere Folgen be- 
nutzt, deren Verhalten etwas ausführlicher untersucht wurde. Wir gehen nun sehr 
kurz auf Fragen ein, die mit der Benutzung dieser Folgen im Zusammenhang 
stehen, wobei wir im wesentlichen algorithmische Aspekte im Auge haben. 

Wie schon am Schluß von Kap. IV, $ 1, bemerkt wurde, hängen die statistischen 
Teste, die auf eine bestimmte Zahlenfolge formal angewendet werden, eng zu- 
sammen mit dem Fehler bei der Integration für eine hinreichend umfangreiche 
Funktionenklasse. Für das Analogon der Kolmogoroffschen Restgröße in bezug 
auf determinierte Folgen wird auch der Terminus ‚Diskrepanz‘ benutzt. 

Ist &,, %g, ..., &y eine Punktfolge im s-dimensionalen Würfel 


Det sH<D); Tess} 
und D,(y) ein in diesem Würfel enthaltenes s-dimensionales Parallelepiped 
Dy)= (su <y<ti; i=], +8} y= (yı .. Ye) > 


dann heißt die Funktion g(y) = N"!v(y) (N Anzahl der Glieder der Folge; »(z) 
Anzahl derjenigen Glieder, die in D,(y) liegen) die lokale Diskrepanz der Folge 
aus N Punkten. Die Größe sup |g(@)| = D{a„}, z€ D,, die auch ein Analogon 
der Kolmogoroffschen Testgröße darstellt, heißt Diskrepanz der Folge. Man 
betrachtet aber auch andere Normen für die Funktion g(z), beispielsweise 


1/ 
Tia,) = | je® de] 


(Analogon der Testgröße vox-MISES-SMIRNOW). 
Rora [1] erhielt für die Größe 7’{x,„} folgende Abschätzung nach unten: 


(log, Aye-ni2 


N > „er ro, 7.3.1 

NT {an} _——, 4 ((s BAR ı1)1)42 ( ) 
Da Tix,} < D{x,„} gilt, ergibt sich daraus 

Dix,} > c,N! (log Nye-D, (7.3.2) 


wobei die Konstante c, nicht von N abhängt. 
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Es gibt eine Reihe von Arbeiten, in denen Folgen mit recht guten Diskrepanz- 
eigenschaften konstruiert werden (z. B. Harrox [1], SoBoL [7]). Diese Folgen 
können bei Rechnungen mit der Monte-Carlo-Methode als Pseudozufallszahlen 
benutzt werden. In diesem Zusammenhang ist es richtig, noch einmal auf die 
schon zitierte Monographie von SoBoL [7] hinzuweisen. Dort werden diese Fragen 
recht ausführlich dargestellt, es werden verschiedene Kriterien für Gleichverteilt- 
heit erörtert und eine umfangreiche Bibliographie angegeben. Auch die Arbeit 
von KoRoBoWw [4] enthält hierzu Aussagen. 


Kann eine Aufgabe auf die Berechnung eines s-fachen Integrals über dem 
Einheitswürfel zurückgeführt werden, so kann im allgemeinen der klassische, in 

Kap. IV, $ 1, genannte Weg Anwendung finden. Die einzige Besonderheit, die 
gewöhnlich im Zusammenhang mit der Lösung der in $ 2 beschriebenen Aufgaben 
entsteht, ist die geringe Glattheit der zu integrierenden Funktionen. So verhält, 
es sich aber nur, wenn die Vielfachheit s fest ist. Bei der Berechnung der Mittel- 
werte über die Trajektorien eines Zufallsprozesses ist es schwer, s im voraus zu 
bestimmen. Mehr noch, die Anzahl der Glieder in einer Trajektorie einer Mar- 
koffschen Kette mit Absorption stellt eine Zufallsgröße dar. In diesen Fällen 
muß der Charakter des Integrationsverfahrens sukzessiv sein, d. h., die neuen 
Stützstellen der Quadraturformel müssen zu den vorher benutzten ohne Änderung 
der letzten hinzugefügt werden. Es sind eine Reihe von Quadraturformeln her- 
geleitet worden, die dieser Forderung genügen. Sie fanden Anwendung bei der 
Lösung von Aufgaben des Strahlendurchgangs mit der Monte-Carlo-Methode 
(Korogow [3], S. 87—92; GELFAND, FRINBERG, FROoLOW und TscHEnzow [1], 
SoBoL [7]). 


Ein anderer Weg besteht darin, dal bei der Integration der Funktion f(z,, ..., 
%p ..,%) mach den ersten r.Veränderlichen eine Quadraturformel mit gleichen 
Gewichten gewählt wird. Die Veränderlichen x,-1, ..., 2, werden in jedem Glied 
der Quadratursumme durch die gleichen unabhängigen Realisierungen der gleich- 
verteilten Zufallsgröße x ersetzt. Insbesondere kann für die Integration nach den 
ersten r Veränderlichen die Quadraturformel von KoroBow (Kap. IV, $ 1) benutzt 
werden. Für die Menge ihrer Stützstellen gilt übrigens folgende Abschätzung der 
Diskrepanz: 


Dyix, < Blog’ N)N-!. (7.3.3) 


Dabei sind B und £# von N unabhängige Konstanten. Die Abschätzung selbst 
Fe aus der Tatsache, daß die charakteristische Funktion des Parallelepipeds 

D,(y) zur Funktionenklasse #5 gehört und aus der Abschätzung (4.1.16). Ein 
Vergleich der Abschätzungen (7. 3.2) und (7.3.3) zeigt, daß die Methode der opti- 
malen Koeffizienten zu einer Punktmenge führt, deren Diskrepanz sich von der 
minimalen nur um eine Größe von der Ordnung log’: N/N unterscheidet (ß, ist 
eine von N unabhängige Konstante). Daher gibt es eine enge Beziehung zwischen 
der Monte-Carlo-Methode in der in den ersten sechs Kapiteln beschriebenen Form 
und den Quadraturformeln zur Integration von Funktionen geringer Glattheit. 
Es ist daran zu erinnern, daß die geringe Glattheit des Integranden mit der Art 
der Darstellung des Maßes, über das die Integration ausgeführt wird, verknüpft 


17 Ermakow, Monte-Carlo-Methode 
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ist, Methoden, mit deren Hilfe diese Darstellung des Maßes verwirklicht wird, 
wurden im zweiten Kapitel beschrieben. 

Außerdem zeigt ein Vergleich der Umkehrformeln und der v.-Neumannschen 
Methode für die Modellierung von Zufallsgrößen, daß in vielen Fällen eine Ver- 
einfachung des Algorithmus (Benutzung der v.-Neumannschen Methode oder 
einer ihrer Modifikationen anstelle der Umkehrformeln) zur einer Vergrößerung 
der Vielfachheit des zu berechnenden Integrals führt. 

So erscheint vom Standpunkt der numerischen Mathematik die Vergrößerung 
der Vielfachheit des zu berechnenden Integrals und meistens auch die Verrin- 
gerung der Glattheit des Integranden zugunsten einer Vereinfachung des Algo- 
rithmus als eine, charakteristische Besonderheit der Monte-Carlo-Methode. Wie 
die Ergebnisse zeigen, ist ein solcher Weg, der durch die Entwicklung der Rechen- 
technik hervorgerufen wurde, in vielen Fällen sehr fruchtbar. 
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